Después de más de un año en desarrollo, Lore Machine ya está disponible para el público por primera vez. Por 10 dólares al mes, puedes cargar 100.000 palabras de texto (hasta 30.000 palabras a la vez) y generar 80 imágenes para historias cortas, guiones, transcripciones de podcasts y más. También hay precios para usuarios avanzados, incluido un plan empresarial que cuesta 160 dólares al mes y cubre 2,24 millones de palabras y 1.792 imágenes. Las ilustraciones vienen en una variedad de estilos preestablecidos, desde manga hasta acuarela y programas de televisión pulp de los 80.
Zac Ryder, fundador de la agencia creativa Modern Arts, ha estado utilizando una versión de acceso temprano de la herramienta desde que el fundador de Lore Machine, Thobey Campion, le mostró por primera vez lo que podía hacer. Ryder envió un guión para un cortometraje y Campion usó Lore Machine para convertirlo en una novela gráfica de 16 páginas de la noche a la mañana.
“Recuerdo que Thobey compartió su pantalla. Todos estábamos completamente anonadados”, dice Ryder. “No se trataba tanto del aspecto de generación de imágenes. Era el nivel de la narración. Desde el flujo de la narrativa hasta la emoción de los personajes, fue acertado desde el principio”.
Modern Arts ahora utiliza Lore Machine para desarrollar un universo ficticio para una serie manga basada en un texto escrito por el creador de Netflix Amor, muerte y robots.
Debajo del capó, Lore Machine está construida a partir de piezas familiares. Un modelo de lenguaje grande escanea su texto, identificando descripciones de personas y lugares, así como su sentimiento general. Una versión de Stable Diffusion genera las imágenes. Lo que lo distingue es lo fácil que es de usar. Entre cargar mi historia y descargar su guión gráfico, hice clic tal vez media docena de veces.
Eso lo convierte en parte de una nueva ola de herramientas fáciles de usar que ocultan el sorprendente poder de los modelos generativos detrás de una interfaz web de un solo clic. “Es mucho trabajo mantenerse al día con las nuevas herramientas de IA, y la interfaz y el flujo de trabajo de cada herramienta es diferente”, dice Ben Palmer, director ejecutivo de New Computer Corporation, una empresa de creación de contenidos. “Usar una megaherramienta con una interfaz de usuario consistente es muy convincente. Siento que aquí es donde aterrizará la industria”.
¡Mirar! Sin indicaciones
Campion creó la empresa detrás de Lore Machine hace dos años para trabajar en una versión blockchain de Wikipedia. Pero cuando vio cómo la gente adoptaba los modelos generativos, cambió de dirección. Campion utilizó el modelo Midjourney de conversión de texto a imagen de uso gratuito para hacer una versión de cómic de Samuel Taylor Coleridge. La rima del viejo marinero. Se volvió viral, dice, pero no fue divertido hacerlo.
“Mi esposa odiaba ese proyecto”, dice. “Estaba hasta las cuatro de la mañana, todas las noches, trabajando duro, tratando de conseguir estas imágenes correctamente”. El problema era que los modelos de conversión de texto a imagen como Midjourney generan imágenes una por una. Eso dificulta mantener la coherencia entre diferentes imágenes de los mismos personajes. Incluso fijar un estilo específico en varias imágenes puede resultar complicado. “Terminé desviándome hacia una expresión más abstracta y alucinante”, dice Campion.