Los generadores de arte de texto AI obstaculizan a los artistas más de lo que los ayudan

Los generadores de arte de texto AI obstaculizan a los artistas más de lo que los ayudan

Imágenes generadas por IA de perros Shiba Inu y la Mona Lisa

Obtener una imagen deseada puede ser un largo ejercicio de prueba y error.
Captura de pantalla: IA abierta

Hacer arte usando inteligencia artificial no es nuevo. Es tan antiguo como la propia IA..

Lo nuevo es que una ola de herramientas ahora permite que la mayoría de las personas generen imágenes ingresando un mensaje de texto. Todo lo que necesita hacer es escribir “un paisaje al estilo de Van Gogh” en un cuadro de texto, y la IA puede crear una hermosa imagen según las instrucciones.

El poder de esta tecnología radica en su capacidad de utilizar el lenguaje humano para controlar la generación de arte. Pero, ¿estos sistemas traducen con precisión la visión de un artista? ¿Llevar el lenguaje a la creación de arte puede conducir realmente a avances artísticos?

Salidas de ingeniería

He trabajado con IA generativa como artista e informático durante años, y diría que este nuevo tipo de herramienta restringe el proceso creativo.

Cuando escribe un mensaje de texto para generar una imagen con IA, hay infinitas posibilidades. Si es un usuario ocasional, puede estar satisfecho con lo que la IA genera para usted. Y startups e inversores han derramado miles de millones en esta tecnología, viéndola como una forma fácil de generar gráficos para artículos, personajes de videojuegos y anuncios.

La IA generativa se considera una herramienta prometedora para crear personajes de videojuegos.

La IA generativa se considera una herramienta prometedora para crear personajes de videojuegos.
Captura de pantalla: Benlisquare/Wikimedia Commons, CC BY-SA

Por el contrario, es posible que un artista necesite escribir un mensaje similar a un ensayo para generar una imagen de alta calidad que refleje su visión, con la composición adecuada, la iluminación adecuada y el sombreado correcto. Ese mensaje largo no es necesariamente descriptivo de la imagen, pero generalmente usa muchas palabras clave para invocar el sistema de lo que está en la mente del artista. Hay un término r elativamente nuevo para esto: pronta ingenieria

.

Básicamente, el papel de un artista que utiliza estas herramientas se reduce a la ingeniería inversa del sistema para encontrar las palabras clave adecuadas para obligar al sistema a generar el resultado deseado. Se necesita mucho esfuerzo y mucho ensayo y error para encontrar las palabras correctas.

La IA no es tan inteligente como parece

Para aprender a controlar mejor las salidas, es importante reconocer que la mayoría de estos sistemas están capacitados en imágenes y subtítulos de Internet.

Piense en lo que un pie de foto típico dice sobre una imagen. Los subtítulos generalmente se escriben para complementar la experiencia visual en la navegación web.

Por ejemplo, la leyenda podría describir el nombre del fotógrafo y el titular de los derechos de autor. En algunos sitios web, como Flickr, una leyenda generalmente describe el tipo de cámara y la lente utilizada. En otros sitios, el pie de foto describe el motor gráfico y el hardware utilizados para representar una imagen.

Entonces, para escribir un mensaje de texto útil, los usuarios deben insertar muchas palabras clave no descriptivas para que el sistema de IA cree una imagen correspondiente.

Los sistemas de IA de hoy no son tan inteligentes como parecen; son esencialmente sistemas de recuperación inteligente que tienen una gran memoria y funcionan por asociación.

Artistas frustrados por la falta de control

¿Es este realmente el tipo de herramienta que puede ayudar a los artistas a crear un gran trabajo?

En Playform AI, una plataforma de arte generativo de IA que fundé, dirigió un encuesta para comprender mejor las experiencias de los artistas con la IA generativa. Recopilamos respuestas de más de 500 artistas digitales, pintores tradicionales, fotógrafos, ilustradores y diseñadores gráficos que habían utilizado plataformas como DALL-E, Stable Diffusion y Midjourney, entre otras.

Solo el 46 % de los encuestados consideró que estas herramientas eran “muy útiles”, mientras que el 32 % las consideró algo útiles, pero no pudo integrarlas en su flujo de trabajo. El resto de los usuarios, el 22%, no los encontró útiles en absoluto.

La principal limitación que destacaron los artistas y diseñadores fue la falta de control. En una escala de 0 a 10, donde 10 es el máximo control, los encuestados describieron su capacidad para controlar el resultado entre 4 y 5. La mitad de los encuestados encontraron los resultados interesantes, pero no de una calidad lo suficientemente alta como para ser utilizados en su práctica.

En cuanto a las creencias sobre si la IA generativa influiría en su práctica, el 90 % de los artistas encuestados pensó que sí; El 46% creía que el efecto sería positivo, y el 7% predijo que tendría un efecto negativo. Y el 37 % pensó que su práctica se vería afectada, pero no estaba seguro de qué manera.

El mejor arte visual trasciende el lenguaje

¿Son fundamentales estas limitaciones o simplemente desaparecerán a medida que mejore la tecnología?

Por supuesto, las versiones más nuevas de IA generativa brindarán a los usuarios más control sobre los resultados, junto con resoluciones más altas y una mejor calidad de imagen.

Pero para mí, la principal limitación, en lo que respecta al arte, es fundamental: es el proceso de usar el lenguaje como el principal motor para generar la imagen.

Los artistas visuales, por definición, son pensadores visuales. Cuando imaginan su trabajo, generalmente se basan en referencias visuales, no en palabras: un recuerdo, una colección de fotografías u otro arte que hayan encontrado.

Cuando el lenguaje está en el asiento del conductor de la generación de imágenes, veo una barrera adicional entre el artista y el lienzo digital. Los píxeles se representarán solo a través de la lente del lenguaje. Los artistas pierden la libertad de manipular píxeles fuera de los límites de la semántica.

La misma entrada puede conducir a un rango de salidas aleatorias.

La misma entrada puede conducir a un rango de salidas aleatorias.
Captura de pantalla: OpenAI/Wikimedia Commons

Hay otra limitación fundamental en la tecnología de texto a imagen.

Si dos artistas ingresan exactamente el mismo aviso, es muy poco probable que el sistema genere la misma imagen. Eso no se debe a nada que haya hecho el artista; los diferentes resultados se deben simplemente a la IA a partir de diferentes imágenes iniciales aleatorias.

En otras palabras, la producción del artista se reduce al azar.

A casi dos tercios de los artistas que encuestamos les preocupaba que sus generaciones de IA pudieran ser similares a las obras de otros artistas y que la tecnología no reflejara su identidad, o incluso la reemplazara por completo.

La cuestión de la identidad del artista es crucial a la hora de hacer y reconocer el arte. En el siglo XIX, cuando la fotografía comenzaba a popularizarse, había un debate sobre si la fotografía era una forma de arte. Se llegó a un caso judicial en Francia en 1861 para decidir si la fotografía podía tener derechos de autor como una forma de arte. La decisión dependía de si la identidad única de un artista podía expresarse a través de fotografías.

Esas mismas preguntas surgen al considerar los sistemas de IA que se enseñan con las imágenes existentes en Internet.

Antes de la aparición de las indicaciones de texto a imagen, crear arte con IA fue un proceso más elaborado: los artistas generalmente entrenaron sus propios modelos de IA en función de sus propias imágenes. Eso les permitió usar su propio trabajo como referencias visuales y retener más control sobre los resultados, que reflejaban mejor su estilo único.

Las herramientas de texto a imagen pueden ser útiles para ciertos creadores y usuarios ocasionales que desean crear gráficos para una presentación de trabajo o una publicación en las redes sociales.

Pero cuando se trata de arte, no puedo ver cómo el software de texto a imagen puede reflejar adecuadamente las verdaderas intenciones del artista o capturar la belleza y la resonancia emocional o las obras que atrapan a los espectadores y les hacen ver el mundo de nuevo.


¿Quiere saber más sobre la IA, los chatbots y el futuro del aprendizaje automático? Consulte nuestra cobertura completa de inteligencia artificialo explore nuestras guías para Los mejores generadores de arte de IA gratuitos y Todo lo que sabemos sobre ChatGPT de OpenAI.

Ahmed ElgammalProfesor de Informática y Director del Art & AI Lab, Universidad Rutgers

Este artículo se vuelve a publicar de La conversación bajo una licencia Creative Commons. Leer el artículo original.

Leave a Reply

Your email address will not be published. Required fields are marked *