Meta presenta un nuevo modelo de lenguaje grande, LLaMA

Así lo anunció el cofundador de Facebook, Mark Zuckerberg, el viernes. metaplataformas‘ próximo lanzamiento de un nuevo modelo de lenguaje grande llamado LLaMA (Large Language Model Meta AI) para investigadores. El modelo, desarrollado por el meta-equipo de Investigación Fundamental de IA (FAIR), está destinado a ayudar a los científicos e ingenieros a explorar aplicaciones y funciones de IA, como responder preguntas y resumir documentos.

El lanzamiento de LLaMA se produce cuando las empresas tecnológicas se esfuerzan por fomentar los avances en las técnicas de IA e integrar la tecnología en sus productos comerciales. Como CNBC

señala que la versión de Meta difiere de los modelos de la competencia, ya que estará disponible en una variedad de tamaños, desde 7 mil millones de parámetros hasta 65 mil millones de parámetros. Además, Zuckerberg dijo que la nueva tecnología LLM de su compañía, que eventualmente podría resolver problemas matemáticos y realizar investigaciones científicas, estará disponible para la comunidad de investigación, y Meta ahora acepta solicitudes de acceso. Este es un cambio con respecto a los modelos subyacentes de Google LaMDA y ChatGPT, que no están disponibles públicamente.

Reuters señala que Meta se une a una carrera cada vez más intensa por la supremacía en la tecnología de IA que comenzó en serio a fines de 2022 con ChatGPT de OpenAI. Con respecto a Meta, el lanzamiento de LLaMA también representa su compromiso con la ciencia abierta, de ahí la decisión de lanzar públicamente el modelo fundamental de lenguaje grande de última generación y proporcionar a los investigadores un recurso abierto para avanzar en su trabajo. Meta cree que el suyo demostrará ser versátil y con múltiples casos de uso, a diferencia de los modelos finamente ajustados diseñados para propósitos específicos.

LLaMA también es diferente en otros aspectos, según Meta: requiere “mucho menos” poder de cómputo que las ofertas anteriores y está capacitado en 20 idiomas, con un enfoque en los que se basan en los alfabetos latino y cirílico. Con sus 13 mil millones de parámetros, LLaMA debería superar a GPT-3, el modelo en el que se basa ChatGPT. Meta también atribuyó el desempeño de LLaMA a datos “más limpios” y “mejoras arquitectónicas” en el modelo que mejoraron la estabilidad del entrenamiento.

Para mantener la integridad del modelo y evitar el mal uso, Meta lo lanzará bajo una licencia no comercial enfocada en casos de uso de investigación. Los investigadores académicos, los gobiernos, la sociedad civil, las instituciones académicas y los laboratorios de investigación industrial tienen acceso al modelo caso por caso.

La introducción de LLaMA por parte de Meta podría marcar un desarrollo importante en los modelos de lenguaje de IA. El compromiso del gigante de las redes sociales con la ciencia abierta y permitir que los investigadores estudien bajo una licencia no comercial limitará el abuso del modelo.

La versatilidad y el potencial de resolución de problemas de LLaMA pueden proporcionar a miles de millones de personas información sobre los importantes beneficios potenciales de la IA.

Leave a Reply Cancel reply