A principios de esta semana, el equipo detrás de la tecnología avanzada de Google Mente profunda red neuronal dio a conocer una nueva capacidad denominada Transencuadrador, que permite a la IA generar videos de 30 segundos a partir de una sola entrada de imagen. Es un pequeño truco ingenioso a primera vista, pero las implicaciones son mucho más grandes que un archivo .GIF interesante.
“Transframer es lo último en una variedad de puntos de referencia de generación de video y… puede generar videos coherentes de 30 segundos a partir de una sola imagen sin ninguna información geométrica explícita”, el equipo de investigación de DeepMind explica
“Dada una colección de imágenes de contexto con anotaciones asociadas (marcas de tiempo, puntos de vista de cámara, etc.) y una anotación de consulta, la tarea es predecir una distribución de probabilidad sobre la imagen de destino”, continúa el equipo. “Este marco admite una variedad de tareas de predicción visual, incluido el modelado de video, la síntesis de vista novedosa y la visión multitarea”.
Como lo señaló futurismo, Transframer podría algún día ofrecer una vía completamente nueva dentro de la industria de los videojuegos al utilizar el aprendizaje automático para crear entornos digitales en lugar de depender de métodos de renderizado que consumen más tiempo. A medida que avanza la tecnología, la capacitación Transframer de DeepMind podría abrir caminos completamente nuevos para el arte, el análisis científico y un mayor desarrollo de la IA. Además, uno usuario de Twitter imaginó aprovechar sus imágenes DALL-E de OpenAI sobre el programa Transframer para crear creaciones de IA apiladas, como si esas imágenes no pudieran volverse más surrealistas.