“Demasiado fácil”: Midjourney prueba una nueva y espectacular versión de su generador de imágenes de IA

“Demasiado fácil”: Midjourney prueba una nueva y espectacular versión de su generador de imágenes de IA
Ocho imágenes que generamos con la versión alfa de Midjourney v4.
Agrandar / Ocho imágenes que generamos con la versión alfa de Midjourney v4.

Ars Technica

El sábado, servicio de imágenes AI a mitad de camino comenzó la prueba alfa de la versión 4 (“v4”) de su modelo de síntesis de texto a imagen, que está disponible para suscriptores en su servidor de discordia. El nuevo modelo proporciona más detalles que los disponibles anteriormente, lo que inspiró a algunos artistas de IA a comentar que v4 casi lo hace “demasiado fácil” para obtener resultados de alta calidad a partir de indicaciones sencillas.

Midjourney se abrió al público en marzo como parte de una ola temprana de modelos de síntesis de imágenes de IA. Rápidamente ganó muchos seguidores debido a su estilo distintivo y por estar disponible públicamente antes que DALL-E y Stable Diffusion. En poco tiempo, las obras de arte creadas por Midjourney llegaron a las noticias al ganar concursos de arte, proporcionar material para registros de derechos de autor potencialmente históricos y aparecer en sitios web de ilustraciones de archivo (que luego fueron prohibidos).

Con el tiempo, Midjourney perfeccionó su modelo con más capacitación, nuevas características y mayor detalle. El modelo predeterminado actual, conocido como “v3”, debutó en agosto. Ahora, Midjourney v4 está siendo puesto a prueba por miles de miembros del servidor Discord del servicio que crean imágenes a través del bot Midjourney. Actualmente, los usuarios pueden probar v4 agregando “–v 4” a sus indicaciones.

“V4 es una base de código completamente nueva y una arquitectura de IA totalmente nueva”, escribió el fundador de Midjourney, David Holz, en un anuncio de Discord. “Es nuestro primer modelo entrenado en un nuevo supercúmulo de IA de Midjourney y ha estado en proceso durante más de 9 meses”.

Salida de comparación entre Midjourney v3 (izquierda) y v4 (derecha) con el aviso
Agrandar / Salida de comparación entre Midjourney v3 (izquierda) y v4 (derecha) con el mensaje “un bárbaro musculoso con armas al lado de un televisor CRT, cinematográfico, 8K, iluminación de estudio”.

Ars Technica

En nuestras pruebas del modelo v4 de Midjourney, encontramos que proporciona una cantidad mucho mayor de detalles que v3, una mejor comprensión de las indicaciones, mejores composiciones de escena y, a veces, mejor proporcionalidad en sus temas. Cuando buscamos imágenes fotorrealistas, algunos resultados que hemos visto pueden ser difíciles de distinguir de las fotos reales con resoluciones más bajas.

Según Holz, otras características de v4 incluyen:

– Mucho más conocimiento (de criaturas, lugares y más)
– Mucho mejor para acertar con los pequeños detalles (en todas las situaciones)
– Maneja indicaciones más complejas (con múltiples niveles de detalle)
– Mejor con escenas multi-objeto/multi-personaje
– Admite funciones avanzadas como indicaciones de imágenes y múltiples indicaciones
– Admite –chaos arg (configúrelo de 0 a 100) para controlar la variedad de cuadrículas de imágenes

La reacción a Midjourney v4 ha sido positiva en Discord del servicio, y los fanáticos de otros modelos de síntesis de imágenes, que regularmente luchan con indicaciones complejas para obtener buenos resultados, están tomando nota.

Un usuario de Reddit llamado Jon Bristow al corriente en la comunidad r/StableDiffusion, “¿Alguien más siente que Midjourney v4 es ‘demasiado fácil’? Esto fue ‘Fotografía de primer plano de una cara’ y parece que no lo lograste. Como si estuviera prefabricado”. En respuesta, alguien bromeó“Triste por los apuntadores Pro que perderán su nuevo trabajo creado hace un mes”.

Midjourney dice que v4 todavía está en alfa, por lo que continuará corrigiendo las peculiaridades del nuevo modelo con el tiempo. La compañía planea aumentar la resolución y la calidad de las imágenes mejoradas de v4, agregar relaciones de aspecto personalizadas (como v3), aumentar la nitidez de la imagen y reducir los artefactos de texto. Midjourney está disponible por un mes cuota de suscripción que oscila entre US $ 10 y $ 50 por mes.

Teniendo en cuenta el progreso que Midjourney ha logrado durante ocho meses de trabajo, nos preguntamos qué traerá el progreso del próximo año en la síntesis de imágenes.

Ir a debate…

Leave a Reply

Your email address will not be published. Required fields are marked *