Microsoft lleva la generación de imágenes de IA a la corriente principal y se adentra en un campo minado de ética

Microsoft lleva la generación de imágenes de IA a la corriente principal y se adentra en un campo minado de ética
Una vista previa de la funcionalidad de texto a imagen de IA de Microsoft Designer, que puede generar imágenes a partir de indicaciones escritas.
Agrandar / Una vista previa de la función de texto a imagen de IA de Microsoft Designer, que puede generar imágenes a partir de indicaciones escritas.

microsoft

Durante un evento de prensa de Surface hoy, Microsoft anunció la integración de la tecnología de generación de imágenes impulsada por IA en su motor de búsqueda Bing, el navegador Edge y una nueva aplicación de Office llamada Microsoft Designer. La tecnología estará impulsada por DALL-E 2 de OpenAI, que causó sensación en abril por su capacidad para generar imágenes novedosas basadas en indicaciones escritas. La tecnología también ha sido objeto de ira entre algunos artistas debido a preocupaciones éticas.

Las ofertas de Microsoft tienen como objetivo ayudar a los creadores a superar el síndrome de la página en blanco sugiriendo cursos de acción creativos. En un ejemplo de Microsoft Designer proporcionado por Microsoft, alguien escribe una descripción de lo que quiere ver, como “Pastel Ombre decorado con flores y fol laje de otoño”, y luego puede desplazarse a través de ejemplos de imágenes generadas por IA que puede elegir. añadir a su diseño. “Designer lo invita a comenzar con una idea y dejar que la IA haga el trabajo pesado”, escribió Microsoft en un comunicado de prensa.

Una vista previa de GIF animado de la aplicación Microsoft Designer "Empezar desde el principio" función proporcionada por Microsoft.
Agrandar / Una vista previa de GIF animado de la función “Comenzar desde cero” de la aplicación Microsoft Designer, proporcionada por Microsoft.

microsoft

Microsoft Designer se originó como parte de PowerPoint, donde actualmente sugiere ideas de diseño como un subconjunto de ese programa. Pero Microsoft planea incluir a Designer en su propia aplicación Microsoft 365 que estará disponible como aplicación gratuita y como aplicación premium disponible para los suscriptores de Microsoft 365 Personal y Family. Por ahora, Microsoft limita Designer a una aplicación web pública gratuita, que utilizará para recopilar comentarios de las pruebas públicas.

Una vista previa de GIF animado de Image Creator de Microsoft Bing, proporcionada por Microsoft.

Una vista previa de GIF animado de Image Creator de Microsoft Bing, proporcionada por Microsoft.

microsoft

Microsoft también anunció que integrará Designer en Microsoft Edge para ofrecer “sugerencias de diseño impulsadas por IA para mejorar visualmente las publicaciones en las redes sociales y otro contenido visual sin tener que salir de la ventana del navegador”. Y la síntesis de imágenes de IA también llegará a Bing con Image Creator, donde las personas podrán escribir un aviso y obtener un resultado novedoso, impulsado por DALL-E 2 de OpenAI.

El elefante ético en la habitación

Desde que OpenAI presentó DALL-E 2 en abril, la generación de imágenes de IA ha sido controvertida con algunos artistas debido a su funcionamiento. Los modelos de síntesis de imágenes como DALL-E 2 utilizan redes neuronales de aprendizaje profundo para analizar millones o miles de millones de imágenes que se encuentran públicamente en la web sin buscar el consentimiento de los artistas o los titulares de los derechos de autor. Estos modelos, incluido el competidor de DALL-E Stable Diffusion, vinculan estadísticamente el contenido de esas imágenes con subtítulos descriptivos que se encuentran en la web para asociarlos con palabras. El resultado es que estos modelos pueden generar imágenes basadas en descripciones de texto y pueden imitar los estilos distintivos de artistas humanos específicos.

Además, los creadores de estos modelos de síntesis de imágenes advierten que reflejan prejuicios sociales como el racismo y el sexismo en sus datos de entrenamiento, y también son capaces de producir imágenes perturbadoras o ilegales si no se implementan medidas de seguridad. Microsoft dice que está abordando estos problemas: “Para ayudar a evitar que DALL∙E 2 brinde resultados inapropiados en la aplicación Designer y Image Creator, estamos trabajando nosotros mismos y con nuestro socio OpenAI, que desarrolló DALL-E 2, para tomar medidas y lo haremos seguir evolucionando nuestro enfoque según sea necesario”.

Las mitigaciones incluyen eliminar “el contenido sexual y violento más explícito” del conjunto de datos de entrenamiento y agregar filtros para “limitar la generación de imágenes que violan la política de contenido”. Con respecto al sesgo, Microsoft menciona la aplicación de “tecnología adicional que ayuda a ofrecer imágenes más diversas a nuestros resultados”, que probablemente sea lo mismo que las inyecciones aleatorias diversas de OpenAI. introducido a DALL-E en julio, que se reunió con alguna controversia sí mismo. Quizás debido a estos problemas, Microsoft está adoptando un enfoque de lanzamiento lento en lugar de abrir las puertas por completo.

“Estamos adoptando un enfoque mesurado para implementar [Image Creator]”, escribió Microsoft en un comunicado de prensa. “Pronto comenzaremos con una vista previa limitada para geografías seleccionadas, lo que nos permitirá recopilar comentarios, aplicar aprendizajes y mejorar la experiencia antes de expandirnos más”.

Con estos movimientos de Microsoft, las herramientas de síntesis de imágenes se están generalizando rápidamente. Canva adicional capacidades de generación de texto a imagen a mediados de septiembre.

Leave a Reply

Your email address will not be published. Required fields are marked *