Aquí se explica cómo probar el nuevo editor de imágenes AI de Apple

Aquí se explica cómo probar el nuevo editor de imágenes AI de Apple

Hay un nuevo editor de imágenes de Apple, si sabes dónde buscar. Los reyes del iPhone se asociaron con investigadores de la Universidad de California en Santa Bárbara para crear una herramienta que permite editar fotografías e imágenes con instrucciones basadas en texto. No tiene un lanzamiento oficial, pero los investigadores están presentando una demostración que puedes probar tú mismo, descubierta por primera vez por Tecnología extrema.

El proyecto se llama Edición de imágenes guiada por modelo de lenguaje grande multimodal (MGIE). Actualmente hay muchos editores de imágenes con IA en el mercado. Photoshop ahora viene con herramientas de inteligencia artificial integradas, y otras, como DALL-E de OpenAI, le permiten editar imágenes además de generarlas desde el principio. Sin embargo, si alguna vez ha intentado utilizarlos, sabrá que puede resultar un poco frustrante. En muchos casos, a la IA le resulta difícil entender exactamente lo que estás buscando.

La innovación con MGIE agrega otra capa de interpretación de IA. Cuando le dices a la IA lo que quieres ver, MGIE primero utiliza una IA basada en texto para que tus instrucciones sean más explícitas y descriptivas. “Los resultados experimentales demuestran que las instrucciones expresivas son cruciales para la edición de imágenes basada en instrucciones”, dijeron los investigadores en un papel publicado en arXiv. “Nuestro MGIE puede conducir a una mejora notable”.

Apple publicó una versión de código abierto del software en GitHub. Si tiene conocimientos, puede ejecutar una versión de MGIE por su cuenta, pero los investigadores configuraron la herramienta en abrazando la cara

. Funciona un poco lento cuando hay mucha gente usándolo, pero es un experimento divertido.

Gigantescas empresas de tecnología como Apple gastan miles de millones de dólares en proyectos que nadie llega a ver, por lo que es muy posible que esta herramienta llamada MGIE nunca tenga un lanzamiento oficial. Apple no respondió de inmediato a una solicitud de comentarios.

Nosotros mismos lo probamos aquí en la oficina de Gizmodo. Subí una foto de mi colega y asesor más cercano, Kyle Barr, con un extraño par de gafas de sol que compró en Netflix en Salón de electrónica de consumo de este año. Le dije a la IA que “el hombre está parado en el desierto”. Antes de generar la imagen, la herramienta MGIE extrapoló:

“El hombre lleva un casco de metal y se encuentra en un entorno desértico. El entorno que lo rodea es árido y árido, con dunas de arena que se extienden hasta donde alcanza la vista”.

Después de jugar con la herramienta durante mucho más tiempo del que deberíamos, está claramente sujeta a muchas de las mismas limitaciones que cualquier otro generador de imágenes de IA. Muchas veces, los resultados son extraños y no se parecen en nada a lo que usted pidió. Pero en algunos casos, hizo un trabajo impresionante y, en defensa del programa, la IA funciona mejor con temas familiares. “Familiares” no es algo que llamarías las gafas de sol de Kyle.

Leave a Reply

Your email address will not be published. Required fields are marked *