El nuevo modelo generativo de Google DeepMind crea juegos tipo Super Mario desde cero

El nuevo modelo generativo de Google DeepMind crea juegos tipo Super Mario desde cero

“Es un trabajo genial”, afirma Matthew Gudzial, investigador de IA de la Universidad de Alberta, que desarrolló un generador de juegos similares Hace unos pocos años.

Genie recibió capacitación con 30.000 horas de video de cientos de juegos de plataformas en 2D tomados de Internet. Otros ya han adoptado ese enfoque antes, dice Gudzial. Su propio generador de juegos aprendió de videos para crear plataformas abstractas

. Nivida usó datos de video para entrenar un modelo llamado JuegoGANque podría producir clones de juegos como Pac-Man.

Pero todos estos ejemplos entrenaron el modelo con acciones de entrada, pulsaciones de botones en un controlador de juegos, así como secuencias de video: un fotograma de video que muestra a Mario saltando se combinó con la acción de “saltar”, y así sucesivamente. Sin embargo, etiquetar secuencias de vídeo con acciones de entrada requiere mucho trabajo. Esto ha limitado la cantidad de datos de entrenamiento disponibles.

Por el contrario, Genie fue entrenado únicamente con imágenes de vídeo. Luego aprendió cuál de las ocho posibles acciones haría que el personaje del juego en un vídeo cambiara de posición. Esto convirtió innumerables horas de vídeos online existentes en posibles datos de entrenamiento.

ejemplo de juego generado a partir de un boceto con crayón
Genie puede generar juegos sencillos a partir de bocetos dibujados a mano

MENTE PROFUNDA DE GOOGLE

Genie genera cada nuevo cuadro del juego sobre la marcha dependiendo de la acción que realiza el jugador. Pulsa saltar y Genie actualiza la imagen actual para mostrar al personaje del juego saltando; presione hacia la izquierda y la imagen cambiará para mostrar el personaje movido hacia la izquierda. El juego avanza acción tras acción, cada nuevo cuadro se genera desde cero a medida que el jugador juega.

Las versiones futuras de Genie podrían ejecutarse más rápido. “No existe ninguna limitación fundamental que nos impida alcanzar los 30 fotogramas por segundo”, afirma Tim Rocktäschel, científico investigador de Google DeepMind que lidera el equipo detrás del trabajo. “Genie utiliza muchas de las mismas tecnologías que los grandes modelos de lenguaje contemporáneos, donde ha habido avances significativos en la mejora de la velocidad de inferencia”.

Genie aprendió algunas peculiaridades visuales comunes que se encuentran en los juegos de plataformas. Muchos juegos de este tipo utilizan paralaje, donde el primer plano se mueve hacia los lados más rápido que el fondo. Genie suele añadir este efecto a los juegos que genera.

Si bien Genie es un proyecto de investigación interno y no se publicará, Gudzial señala que el equipo de Google DeepMind dice que algún día podría convertirse en una herramienta de creación de juegos, algo en lo que él también está trabajando. “Definitivamente estoy interesado en ver lo que construyen”, dice.

Leave a Reply

Your email address will not be published. Required fields are marked *