La nueva IA de Google puede escuchar un fragmento de una canción y luego seguir jugando

La nueva IA de Google puede escuchar un fragmento de una canción y luego seguir jugando

Un nuevo sistema de inteligencia artificial puede crear voz y música con un sonido natural después de que se le indique con unos segundos de audio.

AudioLM, desarrollado por investigadores de Google, genera audio que se adapta al estilo del aviso, incluidos sonidos complejos como música de piano o personas hablando, de una manera que es casi indistinguible de la grabación original. La técnica se muestra prometedora para acelerar el proceso de entrenamiento de la IA para generar audio, y eventualmente podría usarse para generar automáticamente música para acompañar videos.

(Puedes escuchar todos los ejemplos aquí.)

El audio generado por IA es un lugar común: las voces de los asistentes domésticos como Alexa utilizan el procesamiento del lenguaje natural. Los sistemas de música de IA como Jukebox de OpenAI ya han generado resultados impresionantes, pero la mayoría de las técnicas existentes necesitan personas para preparar transcripciones y etiquetar datos de entrenamiento basados ​​en texto, lo que requiere mucho tiempo y trabajo humano. Jukebox, por ejemplo, utiliza datos basados ​​en texto para generar letras de canciones.