Multimodal: la nueva frontera de la IA | Revisión de tecnología del .

Multimodal: la nueva frontera de la IA |  Revisión de tecnología del .

Una tecnología que ve el mundo desde diferentes ángulos

Aún no estamos allí. Los mayores avances en esta dirección se han producido en el incipiente campo de la IA multimodal. El problema no es la falta de visión. Si bien una tecnología capaz de traducirse entre modalidades sería claramente valiosa, Mirella Lapata, profesora de la Universidad de Edimburgo y directora de su Laboratorio de Inteligencia Artificial Integrada, dice que “es mucho más complicada” de ejecutar que la IA unimodal.

En la práctica, las herramientas de IA generativa utilizan diferentes estrategias para diferentes tipos de datos al construir grandes modelos de datos: las complejas redes neuronales que organizan grandes cantidades de información. Por ejemplo, aquellos que se basan en fuentes textuales segregan elementos individuales, normalmente palabras. A cada token se le asigna una “incrustación” o “vector”: una matriz numérica que representa cómo y dónde se usa el token en comparación con otros. En conjunto, el vector crea una representación matemática del significado del token. Un modelo de imagen, por otro lado, podría usar píxeles como tokens para incrustar, y un modelo de audio, frecuencias de sonido.

Un modelo de IA multimodal normalmente se basa en varios modelos unimodales. Como dice Henry Ajder, fundador de la consultora de inteligencia artificial Latent Space, esto implica “casi unir” los diversos modelos contribuyentes. Hacerlo implica varias técnicas para alinear los elementos de cada modelo unimodal, en un proceso llamado fusión. Por ejemplo, la palabra “árbol”, la imagen de un roble y el audio en forma de hojas crujientes podrían fusionarse de esta manera. Esto permite que el modelo cree una descripción multifacética de la realidad.

Este contenido fue producido por Insights, la rama de contenido personalizado de .. No fue escrito por el personal editorial de ..

Leave a Reply

Your email address will not be published. Required fields are marked *