Los actores de voz de IA suenan más humanos que nunca y están listos para contratar

La publicación del blog de la compañía gotea con el entusiasmo de un infomercial estadounidense de los noventa. WellSaid Labs describe lo que los clientes pueden esperar de sus “ocho nuevos actores de voz digitales”. Tobin es “enérgico y perspicaz”. Paige es “serena y expresiva”. Ava es “refinada, segura de sí misma y profesional”.

Cada uno se basa en un actor de voz real, cuya imagen (con consentimiento) se ha conservado mediante IA. Las empresas ahora pueden autorizar estas voces para decir lo que necesiten. Simplemente introducen un poco de texto en el motor de voz y, a partir de ahí, se grabará un clip de audio nítido de una interpretación con un sonido natural.

WellSaid Labs, una startup con sede en Seattle que surgió de la investigación sin fines de lucro Allen Institute of Artificial Intelligence, es la última firma que ofrece voces de inteligencia artificial a sus clientes. Por ahora, se especializa en voces para videos corporativos de e-learning. Otras startups hacen voces para asistentes digitales , operadores de call center, e incluso personajes de videojuegos.

https://api.soundcloud.com/tracks/1084592377

Mientras que las empresas solían tener que contratar diferentes actores de voz para diferentes mercados (el noreste frente al sur de EE. UU. O Francia frente a México), algunas empresas de inteligencia artificial de voz pueden manipular el acento o cambiar el idioma de una sola voz de diferentes maneras. Esto abre la posibilidad de adaptar los anuncios en las plataformas de transmisión en función de quién esté escuchando, cambiando no solo las características de la voz sino también las palabras que se están pronunciando. Un anuncio de cerveza podría decirle a un oyente que pase por un pub diferente dependiendo de si se está reproduciendo en Nueva York o Toronto, por ejemplo. Resemble.ai, que diseña voces para anuncios y asistentes inteligentes, dice que ya está trabajando con los clientes para lanzar anuncios de audio personalizados en Spotify y Pandora.

Las industrias del juego y el entretenimiento también están viendo los beneficios. Sonantic, una firma que se especializa en voces emotivas que pueden reír y llorar o susurrar y gritar, trabaja con creadores de videojuegos y estudios de animación para proporcionar las voces en off de sus personajes. Muchos de sus clientes utilizan las voces sintetizadas solo en la preproducción y cambian a actores de voz reales para la producción final. Pero Sonantic dice que algunos han comenzado a usarlos a lo largo del proceso, quizás para personajes con menos líneas. Resemble.ai y otros también han trabajado con películas y programas de televisión para arreglar las actuaciones de los actores cuando las palabras se confunden o se pronuncian mal.

Heaven32: