Informe: OpenAI retiene las funciones de imagen GPT-4 por temor a problemas de privacidad

Informe: OpenAI retiene las funciones de imagen GPT-4 por temor a problemas de privacidad
Una mujer siendo reconocida facialmente por AI.

Witthaya Prasongsin (imágenes falsas)

OpenAI ha estado probando su versión multimodal de GPT-4 con soporte de reconocimiento de imágenes antes de un lanzamiento amplio planificado. Sin embargo, el acceso público se está restringiendo debido a preocupaciones sobre su capacidad para reconocer potencialmente a personas específicas, según un New York Times. informe el martes.

Cuando OpenAI anunció GPT-4 a principios de este año, la empresa destacó las capacidades multimodales del modelo de IA. Esto significaba que el modelo no solo podía procesar y generar texto, sino también analizar e interpretar imágenes, abriendo una nueva dimensión de interacción con el modelo de IA.

Tras el anuncio, OpenAI llevó sus capacidades de procesamiento de imágenes un paso más allá en colaboración con una startup llamada se mis ojos

que está desarrollando una aplicación para describir imágenes a usuarios invidentes, ayudándoles a interpretar su entorno e interactuar con el mundo de forma más independi ente.

El informe del New York Times destaca las experiencias de Jonathan Mosen, un usuario ciego de Be My Eyes de Nueva Zelanda. Mosen ha disfrutado usando la aplicación para identificar elementos en una habitación de hotel, como dispensadores de champú, y para interpretar con precisión las imágenes y sus publicaciones en las redes sociales. Sin embargo, Mosen expresó su decepción cuando la aplicación dejó de proporcionar información facial recientemente y mostró un mensaje de que las caras se habían ocultado por razones de privacidad.

Sandhini Agarwal, investigadora de políticas de OpenAI, confirmó al Times que los problemas de privacidad son la razón por la cual la organización ha reducido las capacidades de reconocimiento facial de GPT-4. El sistema de OpenAI actualmente es capaz de identificar figuras públicas, como aquellas que tienen una página de Wikipedia, pero a OpenAI le preocupa que la función pueda infringir las leyes de privacidad en regiones como Illinois y Europa, donde el uso de información biométrica requiere el consentimiento explícito de los ciudadanos.

Además, OpenAI expresó su preocupación de que Be My Eyes pudiera malinterpretar o tergiversar aspectos de los rostros de las personas, como el género o el estado emocional, lo que podría generar resultados inapropiados o dañinos. OpenAI tiene como objetivo abordar estos y otros problemas de seguridad antes de que las capacidades de análisis de imágenes de GPT-4 sean ampliamente accesibles. Agarwal le dijo al Times: “Deseamos mucho que esta sea una conversación bidireccional con el público. Si lo que escuchamos es como, ‘En realidad no queremos nada de eso’, eso es algo con lo que estamos muy de acuerdo”.

A pesar de estas precauciones, también ha habido casos de confabulación o identificaciones falsas de GPT-4, lo que subraya el desafío de crear una herramienta útil que no proporcione información inexacta a los usuarios ciegos.

Mientras tanto, Microsoft, un importante inversionista en OpenAI, está probando una implementación limitada de la herramienta de análisis visual en su chatbot Bing impulsado por IA, que se basa en la tecnología GPT-4. Bing Chat se ha visto recientemente en Twitter resolviendo CAPTCHA pruebas diseñadas para descartar bots, lo que también puede retrasar el lanzamiento más amplio de las funciones de procesamiento de imágenes de Bing.

Google también introducido recientemente funciones de análisis de imágenes en su chatbot Bard, que permite a los usuarios cargar imágenes para que Bard las reconozca o las procese. En nuestras pruebas de la función, pudo resolver los CAPTCHA basados ​​en palabras, aunque no siempre a la perfección. Ya, algunos servicios como Roblox usan CAPTCHA muy difícilesprobablemente se mantendrá por delante de mejoras similares en la visión por computadora.

Este tipo de visión por computadora impulsada por IA puede llegar a los dispositivos de todos tarde o temprano, pero también está claro que las empresas deberán resolver las complicaciones antes de que podamos ver lanzamientos amplios con un impacto ético mínimo.

Leave a Reply

Your email address will not be published. Required fields are marked *