OpenAI presenta la API DALL-E para que los desarrolladores puedan integrar su diseño de IA en sus aplicaciones

variaciones de
Agrandar
/ Variaciones de “una foto de un cachorro de corgi feliz con elegantes gafas de sol sentado y mirando hacia adelante, luz de estudio, toma larga” generada por DALL-E de OpenAI.

IA abierta

El jueves, OpenAI Anunciado la introducción de una API para su modelo de síntesis de imágenes DALL-E que permitirá a los desarrolladores integrar fácilmente su tecnología de generación de imágenes de IA en sus aplicaciones. DALL-E, actualmente disponible como un servicio comercial independiente, permite a las personas generar imágenes novedosas de 1024×1024 a partir de descripciones de texto llamadas “indicaciones”. Las imágenes generadas pueden variar en estilo, desde fotorrealistas hasta abstractos, y muchos estilos intermedios.

La nueva API de OpenAI permite a los desarrolladores de software introducir una imagen y otros parámetros en el motor DALL-E de OpenAI a través de Internet. OpenAI luego genera la imagen en sus servidores y devuelve la imagen para mostrarla en la aplicación solicitante. (Un API

es una interfaz de programación que permite que diferentes programas se comuniquen entre sí).

El uso de la API requiere registro con OpenAI y un clave de API privada que permite el acceso al generador DALL-E. Además, OpenAI cobra una tarifa por cada imagen generada según la resolución de la imagen. Las imágenes de 1024×1024 cuestan $0,02 por imagen, las imágenes de 512×512 cuestan $0,018 por imagen y las imágenes de 256×256 cuestan $0,016 por imagen.

Un ejemplo DALL-E de
Agrandar / Un ejemplo DALL-E de “un astronauta montando a caballo”.

IA abierta

Actualmente, Microsoft ya está utilizando la API DALL-E en pruebas de acceso cerrado de su nueva aplicación Microsoft Designer, y Shutterstock anunció recientemente la integración de DALL-E en su sitio web. Además, OpenAI dice que las aplicaciones de diseño llamadas CALÁ y Mixtiles también están utilizando la API de DALL-E.

Desde su lanzamiento en abril, DALL-E y otros modelos de síntesis de imágenes, como Stable Diffusion, han sido objeto de controversia ética debido al sesgo incorporado, la capacidad de generar imágenes potencialmente dañinas y el hecho de que estos modelos generativos de IA han sido entrenados utilizando obras de arte creadas por humanos sin el consentimiento individual del artista. Sin embargo, OpenAI implementa filtros que restringen la generación de desnudos, “símbolos de odio” y violencia en un intento de mantener el servicio aceptable para una audiencia masiva.

Vale la pena señalar que Stable Diffusion ha estado disponible como código abierto desde agosto, y los desarrolladores ya han estado integrando esa tecnología en sus aplicaciones sin el costo de generación de imágenes individuales, filtros o política de contenido restricciones que vienen con la API DALL-E de OpenAI si se ejecuta localmente. Sin embargo, Stability AI también ofrece su propia API DreamStudio por una tarifa que viene con sus propias herramientas de moderación de contenido.

A medida que la competencia entre los modelos de síntesis de imágenes de IA continúa aumentando, los desarrolladores ahora tienen más opciones sobre qué modelo pueden integrar en sus productos.

Leave a Reply

Your email address will not be published. Required fields are marked *