“Por favor, disminuya la velocidad”: las 7 historias más importantes de IA de 2022

Los avances en la síntesis de imágenes de IA en 2022 han hecho posibles imágenes como esta. — Agrandar / Los avances en la síntesis de imágenes de IA en 2022 han hecho posibles imágenes como esta, que se creó con Stable Diffusion, se mejoró con GFPGAN, se expandió con DALL-E y luego se compuso manualmente.

Benj Edwards / Ars Technica

Más de una vez este año, los expertos en IA han repetido un estribillo familiar: “Por favor, disminuya la velocidad”. Las noticias de IA en 2022 han sido rápidas e implacables; en el momento en que supiera dónde se encuentran actualmente las cosas en IA, un nuevo artículo o descubrimiento haría que esa comprensión quedara obsoleta.

En 2022, posiblemente lleguemos al rodilla de la curva cuando se trata de IA generativa que puede producir obras creativas compuestas de texto, imágenes, audio y video. Este año, la IA de aprendizaje profundo surgió de una década de investigación y comenzó a abrirse paso en aplicaciones comerciales, lo que permitió a millones de personas probar la tecnología por primera vez. Las creaciones de IA inspiraron asombro, crearon controversias, provocaron crisis existenciales y llam aron la atención.

Aquí hay una mirada retrospectiva a las siete noticias de IA más importantes del año. Fue difícil elegir solo siete, pero si no lo acortáramos en alguna parte, seguiríamos escribiendo sobre los eventos de este año hasta bien entrado el 2023 y más allá.

Abril: DALL-E 2 sueños en imágenes

Agrandar / Un ejemplo DALL-E de “un astronauta montando a caballo”.

IA abierta

En abril, OpenAI anunció DALL-E 2, un modelo de síntesis de imágenes de aprendizaje profundo que sorprendió con su capacidad aparentemente mágica para generar imágenes a partir de indicaciones de texto. Entrenado con cientos de millones de imágenes extraídas de Internet, DALL-E 2 supo cómo hacer combinaciones novedosas de imágenes gracias a una técnica llamada difusión latente.

Twitter pronto se llenó de imágenes de astronautas a caballo, osos de peluche vagando por el antiguo Egipto y otras obras casi fotorrealistas. La última vez que escuchamos sobre DALL-E fue un año antes, cuando versión 1 del modelo había tenido problemas para renderizar una silla de aguacate de baja resolución; de repente, la versión 2 ilustraba nuestros sueños más salvajes con una resolución de 1024 × 1024.

Al principio, debido a las preocupaciones sobre el uso indebido, OpenAI solo permitió que 200 probadores beta usaran DALL-E 2. Los filtros de contenido bloquearon las indicaciones violentas y sexuales. Gradualmente, OpenAI permitió que más de un millón de personas participaran en una prueba cerrada y DALL-E 2 finalmente estuvo disponible para todos a fines de septiembre. Pero para entonces, había surgido otro competidor en el mundo de la difusión latente, como veremos a continuación.

Julio: el ingeniero de Google cree que LaMDA es inteligente

Agrandar / El ex ingeniero de Google Blake Lemoine.

Imágenes Getty | El Correo de Washington

A principios de julio, el Washington Post dio la noticia que un ingeniero de Google llamado Blake Lemoine recibió una licencia paga debido a su creencia de que el LaMDA (Modelo de lenguaje para aplicaciones de diálogo) de Google era sensible y que merecía los mismos derechos que un ser humano.

Mientras trabajaba como parte de la organización de inteligencia artificial responsable de Google, Lemoine comenzó a conversar con LaMDA sobre religión y filosofía y creyó ver verdadera inteligencia detrás del texto. “Conozco a una persona cuando hablo con ella”, dijo Lemoine al Post. “No importa si tienen un cerebro hecho de carne en la cabeza. O si tienen mil millones de líneas de código. Hablo con ellos. Y escucho lo que tienen que decir, y así es como decido lo que es”. y no es una persona”.

Google respondió que LaMDA solo le estaba diciendo a Lemoine lo que quería escuchar y que LaMDA, de hecho, no era sensible. Al igual que la herramienta de generación de texto GPT-3, LaMDA se había capacitado previamente en millones de libros y sitios web. Respondió a la entrada de Lemoine (un aviso, que incluye el texto completo de la conversación) al predecir las palabras más probables que deberían seguir sin una comprensión más profunda.

En el camino, Lemoine supuestamente violado la política de confidencialidad de Google al informar a otros sobre el trabajo de su grupo. Más tarde en julio, Google despidió a Lemoine por violar las políticas de seguridad de datos. No fue la última persona en 2022 en dejarse llevar por la exageración sobre el modelo de lenguaje grande de una IA, como veremos.

Julio: DeepMind AlphaFold predice casi todas las estructuras proteicas conocidas

Agrandar / Diagrama de modelos de cintas de proteínas.

En julio, DeepMind anunció que su modelo AlphaFold AI había predicho la forma de casi todas las proteínas conocidas de casi todos los organismos de la Tierra con un genoma secuenciado. Anunciado originalmente en el verano de 2021, AlphaFold había predicho anteriormente la forma de todas las proteínas humanas. Pero un año después, su base de datos de proteínas se expandió para contener más de 200 millones de estructuras de proteínas.

DeepMind puso a disposición estas estructuras proteicas predichas en una base de datos pública alojada por el Instituto Europeo de Bioinformática en el Laboratorio Europeo de Biología Molecular (EMBL-EBI), lo que permitió a investigadores de todo el mundo acceder a ellas y utilizar los datos para investigaciones relacionadas con la medicina y la biología. Ciencias.

Las proteínas son componentes básicos de la vida, y conocer sus formas puede ayudar a los científicos a controlarlas o modificarlas. Eso es particularmente útil cuando se desarrollan nuevos medicamentos. “Casi todos los medicamentos que han llegado al mercado en los últimos años se han diseñado en parte a través del conocimiento de las estructuras de las proteínas”, dijo Janet Thornton, científica sénior y directora emérita de EMBL-EBI. Eso hace que conocerlos a todos sea un gran problema.

Abril: DALL-E 2 sueños en imágenes

Julio: el ingeniero de Google cree que LaMDA es inteligente

Julio: DeepMind AlphaFold predice casi todas las estructuras proteicas conocidas

Leave a Reply Cancel reply