
Meta ha creado una forma de marcar con agua el discurso generado por IA

Sin embargo, existen algunas advertencias importantes. Meta dice que aún no tiene planes de aplicar marcas de agua al audio generado por IA creado con sus herramientas. Las marcas de agua de audio aún no se adoptan ampliamente y no existe un estándar industrial único acordado para ellas. Y las marcas de agua para el contenido generado por IA tienden a ser fáciles de alterar, por ejemplo, eliminándolas o falsificándolas.
La detección rápida y la capacidad de identificar qué elementos de un archivo de audio son generados por IA serán fundamentales para que el sistema sea útil, afirma Elsahar. Dice que el equipo logró entre un 90% y un 100% de precisión en la detección de marcas de agua, resultados mucho mejores que en intentos anteriores de poner marcas de agua en el audio.
AudioSeal está disponible en GitHub gratis. Cualquiera puede descargarlo y usarlo para agregar marcas de agua a clips de audio generados por IA. Eventualmente podría superponerse a los modelos de generación de audio de IA, de modo que se aplique automáticamente a cualquier discurso generado con ellos. Los investigadores que lo crearon presentarán su trabajo en la Conferencia Internacional sobre Aprendizaje Automático en Viena, Austria, en julio.
AudioSeal se crea utilizando dos redes neuronales. Uno genera señales de marcas de agua que se pueden incrustar en pistas de audio. Estas señales son imperceptibles para el oído humano, pero pueden detectarse rápidamente utilizando otra red neuronal. Actualmente, si desea intentar detectar audio generado por IA en un clip más largo, debe revisarlo todo en fragmentos de un segundo de duración para ver si alguno de ellos contiene una marca de agua. Este es un proceso lento y laborioso, y no práctico en plataformas de redes sociales con millones de minutos de discurso.
AudioSeal funciona de manera diferente: incorporando una marca de agua en cada sección de toda la pista de audio. Esto permite “localizar” la marca de agua, lo que significa que aún se puede detectar incluso si el audio se recorta o edita.
Ben Zhao, profesor de informática de la Universidad de Chicago, dice que esta capacidad y la precisión de detección casi perfecta hacen que AudioSeal sea mejor que cualquier sistema de marca de agua de audio anterior con el que se haya topado.
“Es significativo explorar investigaciones que mejoren el estado del arte en marcas de agua, especialmente en medios como el habla, que a menudo son más difíciles de marcar y detectar que el contenido visual”, dice Claire Leibowicz, directora de IA e integridad de los medios de la organización sin fines de lucro Partnership on AI.
Pero hay algunos defectos importantes que deben superarse antes de que este tipo de marcas de agua de audio puedan adoptarse en masa. Los investigadores de Meta probaron diferentes ataques para eliminar las marcas de agua y descubrieron que cuanta más información se revela sobre el algoritmo de marcas de agua, más vulnerable es. El sistema también requiere que las personas agreguen voluntariamente la marca de agua a sus archivos de audio.