El generador de imágenes AI Midjourney v5 sorprende con imágenes fotorrealistas y manos de 5 dedos

El generador de imágenes AI Midjourney v5 sorprende con imágenes fotorrealistas y manos de 5 dedos
Un ejemplo de iluminación y efectos de piel en el generador de imágenes AI Midjourney v5.
Agrandar / Un ejemplo de iluminación y efectos de piel en el generador de imágenes AI Midjourney v5.

El miércoles, mitad del viaje Anunciado la versión 5 de su servicio comercial de síntesis de imágenes de IA, que puede producir imágenes fotorrealistas con un nivel de calidad que algunos fanáticos del arte de IA llaman espeluznante y “demasiado perfecto.” Midjourney v5 ya está disponible como prueba alfa para los clientes que se suscriban al servicio Midjourney, que está disponible a través de Discord.

“MJ v5 actualmente me parece como si finalmente me pusiera anteojos después de ignorar la mala vista durante demasiado tiempo”, dijo Julie Wieland, una diseñadora gráfica que a menudo comparte sus creaciones de Midjourney en Twitter. “De repente ves todo en 4k, se siente extrañamente abrumador pero también increíble”.

Wieland compartió algunas de sus generaciones de Midjourney v5 con Ars Technica (visto a continuación en una galería y en la imagen principal de arriba), y ciertamente muestran una progresión en los detalles de la imagen desde que Midjourney llegó por primera vez en marzo de 2022. La versión 3 debutó en agosto y la versión 4 debutó en noviembre. Cada iteración agregó más detalles a los resultados generados, como muestran nuestros experimentos:

Una comparación entre la salida de Midjourney v3 (izquierda), v4 (centro) y v5 (derecha) con el indicador
Agrandar / Una comparación entre la salida de Midjourney v3 (izquierda), v4 (centro) y v5 (derecha) con el mensaje “un bárbaro musculoso con armas al lado de un televisor CRT, cinemático, 8K, iluminación de estudio”.

Ars Technica

Midjourney funciona de manera similar a los sintetizadores de imágenes como Stable Diffusion y DALL-E en el sentido de que genera imágenes basadas en descripciones de texto llamadas “indicaciones” utilizando un modelo de IA entrenado en millones de obras de arte hechas por humanos. Recientemente, Midjourney estuvo en el centro de una controversia de derechos de autor con respecto a un cómic que usaba versiones anteriores del servicio.

Después de experimentar con v5 por un día, Wieland notó mejoras que incluyen texturas de piel y rasgos faciales “increíblemente realistas”; iluminación más realista o cinematográfica; mejores reflejos, resplandores y sombras; ángulos más expresivos o vistas generales de una escena, y “ojos que son casi perfectos y ya no torcidos”.

Y, por supuesto, las manos.

Durante el año pasado, la idea de que los generadores de arte de IA no pueden representar las manos correctamente se ha convertido en una especie de tropo cultural. En particular, Midjourney v5 puede generar manos humanas realistas bastante bien. “Las manos son correctas la mayor parte del tiempo, con 5 dedos en lugar de 7-10 en una mano”, dijo Wieland.

En las notas de lanzamiento de Discord del servicio, Midjourney también señaló que v5 ahora responde con un “rango estilístico mucho más amplio” que la versión 4, al mismo tiempo que es más sensible a las indicaciones, genera menos texto no deseado y ofrece un aumento de 2x en la resolución de la imagen.

Si hay una desventaja visual en la actualización de Midjourney para los fanáticos del arte de IA, tal vez provenga de imágenes que pueden ser tan realistas y “perfectas” que la precisión del modelo elimina parte de la emoción de generar repetidamente imágenes de IA para encontrar un resultado adecuado, ¿qué uno podría llamar un “efecto de máquina tragamonedas”. Aunque un usuario de Twitter llamado Philipp Lenssen anotado“Si tiene un tema de imagen específico en mente, todavía es un poco como la lotería. Pero con mayores posibilidades de ganar que v4”.

Leave a Reply

Your email address will not be published. Required fields are marked *