Una nueva herramienta de inteligencia artificial permite intercambiar rostros en tiempo real en las cámaras web, lo que genera preocupaciones por fraude

Una nueva herramienta de inteligencia artificial permite intercambiar rostros en tiempo real en las cámaras web, lo que genera preocupaciones por fraude
Una captura de video fija del usuario X João Fiadeiro reemplazando su rostro con JD Vance en una prueba de Deep-Live-Cam.
Agrandar / Una captura de video fija del usuario X João Fiadeiro reemplazando su rostro con JD Vance en una prueba de Deep-Live-Cam.

En los últimos días, un paquete de software llamado Cámara en vivo profunda ha sido volviéndose viral en las redes sociales, ya que puede tomar el rostro de una persona extraído de una sola foto y aplicarlo a una fuente de video de una cámara web en vivo mientras sigue la pose, la iluminación y las expresiones de la persona en la cámara web. Si bien los resultados no son perfectos, el software muestra cuán rápido se está desarrollando la tecnología y cómo la capacidad de engañar a otros de forma remota se está volviendo mucho más fácil con el tiempo.

El proyecto de software Deep-Live-Cam ha estado en desarrollo desde fines del año pasado, pero hay videos de ejemplo que muestran a una persona imitando a Elon Musk y al candidato republicano a la vicepresidencia. JD Vance (entre otros) en tiempo real han estado circulando en línea. La avalancha de atención hizo que el proyecto de código abierto saltara brevemente al número 1 en GitHub. Lista de repositorios de tendencias

(actualmente se encuentra en el puesto número 4 al momento de escribir este artículo), donde está disponible para descargar de forma gratuita.

Es extraño cómo todas las principales innovaciones que han surgido en el ámbito tecnológico últimamente se encuentran bajo el árbol de habilidades de Fraude”. escribió

El ilustrador Corey Brickley en un hilo de X reacciona a un video de ejemplo de Deep-Live-Cam en acción. En otra publicación, escribió“Es bueno recordar establecer palabras clave con sus padres”, en referencia al potencial de que se utilicen herramientas similares para el engaño remoto y el concepto de usar un palabra seguracompartido entre amigos y familiares, para establecer su verdadera identidad.

Un ejemplo de Deep-Live-Cam en acción, creado por el usuario X João Fiadeiro. Muestra clones de JD Vance, Hugh Grant, Mark Zuckerberg y George Clooney.

La tecnología de intercambio de rostros no es nueva. El término “deepfake” se originó en 2017 a partir de un usuario de Reddit llamado “deepfakes” (combinación de los términos “aprendizaje profundo” y “falsificaciones”), que pornografía publicada que cambiaba la cara de un actor por la de una celebridad. En aquella época, la tecnología era cara y lenta y no funcionaba en tiempo real. Sin embargo, gracias a proyectos como Deep-Live-Cam, cada vez es más fácil para cualquiera utilizar esta tecnología en casa con un ordenador normal y software gratuito.

Los peligros de las deepfakes tampoco son nuevos. En febrero, cubrimos un supuesto robo en Hong Kong en el que alguien se hizo pasar por el director financiero de una empresa a través de una videollamada y se llevó más de 25 millones de dólares. Las deepfakes de audio han dado lugar a otros fraudes financieros o esquemas de extorsión. Podríamos esperar que los casos de fraude de video remoto aumenten con el software de deepfakes en tiempo real fácilmente disponible, y no son solo celebridades o políticos los que podrían verse afectados.

Con un software de intercambio de rostros, alguien podría tomar una foto tuya de las redes sociales y hacerse pasar por ti ante alguien que no esté del todo familiarizado con tu aspecto y tu forma de actuar, dada la necesidad actual de imitar gestos, voz, pelo, ropa y estructura corporal similares. También existen técnicas para clonar esos aspectos de la apariencia y la voz (mediante la clonación de voz y la reproducción de vídeo). Síntesis de IA de imagen a imagen) pero aún no han alcanzado implementaciones fotorrealistas fiables en tiempo real. Pero con el tiempo, es probable que esa tecnología también esté disponible y sea fácil de usar.

¿Cómo funciona?

Al igual que muchos proyectos de código abierto de GitHub, Deep-Live-Cam reúne varios paquetes de software existentes bajo una nueva interfaz (y es en sí mismo una bifurcación de un proyecto anterior llamado “Roop (robo)“). Primero detecta rostros tanto en la imagen de origen como en la de destino (como un fotograma de un video en vivo). Luego utiliza un modelo de IA entrenado previamente llamado “intercambiador“para realizar el intercambio de caras real y otro modelo llamado GFPGAN para mejorar la calidad de las caras intercambiadas mejorando los detalles y corrigiendo los artefactos que ocurren durante el proceso de intercambio de caras.

Una demostración creada por el desarrollador de Deep-Live-Cam que muestra un intercambio de caras con Elon Musk.

Una demostración creada por el desarrollador de Deep-Live-Cam que muestra un intercambio de caras con Elon Musk.

El modelo inswapper, desarrollado por un proyecto llamado cara de introspecciónpuede adivinar cómo podría lucir una persona (en una foto proporcionada) usando diferentes expresiones y desde diferentes ángulos porque fue entrenado en un vasto conjunto de datos que contiene millones de imágenes faciales de miles de individuos capturadas desde varios ángulos, bajo diferentes condiciones de iluminación y con diversas expresiones.

Durante el entrenamiento, la red neuronal subyacente al modelo Inswapper desarrolló una “comprensión” de las estructuras faciales y su dinámica en diversas condiciones, incluida la capacidad de inferir la estructura tridimensional de un rostro a partir de una imagen bidimensional. También se volvió capaz de separar las características específicas de la identidad, que permanecen constantes en diferentes imágenes de la misma persona, de las características específicas de la pose, que cambian con el ángulo y la expresión. Esta separación permite al modelo generar nuevas imágenes de rostros que combinan la identidad de un rostro con la pose, la expresión y la iluminación de otro.

Deep-Live-Cam está lejos de ser el único proyecto de software de intercambio de rostros que existe. Otro proyecto de GitHub, llamado fusión facialutiliza el mismo modelo de IA de intercambio de rostros con una interfaz diferente. La mayoría de ellos dependen en gran medida de una red anidada de Python y bibliotecas de aprendizaje profundo como PyTorch, por lo que Deep-Live-Cam aún no es tan fácil como una instalación de un solo clic. Pero es probable que este tipo de capacidad de intercambio de rostros sea aún más fácil de instalar con el tiempo y probablemente mejore en calidad a medida que las personas iteren y desarrollen el trabajo de los demás en el espacio de desarrollo de IA de código abierto.