Google apuesta por la “IA abierta” con Gemma, una familia de chatbots gratuitos y de peso abierto

Google apuesta por la “IA abierta” con Gemma, una familia de chatbots gratuitos y de peso abierto
El logotipo de Google Gemma

El miércoles Google Anunciado una nueva familia de modelos de lenguaje de IA llamada Gema, que son modelos gratuitos y de peso abierto construidos con tecnología similar a los modelos Gemini más potentes pero cerrados. A diferencia de Gemini, los modelos Gemma pueden ejecutarse localmente en una computadora de escritorio o portátil. Es el primer lanzamiento significativo de un modelo de lenguaje grande abierto (LLM) de Google desde que ChatGPT de OpenAI inició un frenesí por los chatbots de IA en 2022.

Los modelos Gemma vienen en dos tamaños: Gemma 2B (2 mil millones de parámetros) y Gemma 7B (7 mil millones de parámetros), cada uno disponible en variantes previamente entrenadas y ajustadas por instrucciones. En IA, los parámetros son valores en una red neuronal que determinan el comportamiento del modelo de IA, y los pesos son un subconjunto de estos parámetros almacenados en un archivo.

Desarrollado por Google DeepMind y otros equipos de IA de Google, Gemma se basa en técnicas aprendidas durante el desarrollo de Gemini, que es el nombre familiar de los LLM comerciales (de cara al público) más capaces de Google, incluidos los que impulsan su asistente de IA Gemini. Google dice que el nombre proviene del latín. gema

que significa “piedra preciosa”.

Si bien Gemma es el primer LLM abierto importante de Google desde el lanzamiento de ChatGPT (ha lanzado modelos de investigación más pequeños como FLAN-T5 en el pasado), no es la primera contribución de Google a la investigación de IA abierta. La empresa cita el desarrollo de la Arquitectura del transformadorasí como lanzamientos como TensorFlow, BERT, T5y JAX como contribuciones clave, y no sería controvertido decir que han sido importantes para el campo.

Un gráfico del rendimiento de Gemma proporcionado por Google.  Google dice que Gemma supera a Meta's Llama 2 en varios puntos de referencia.
Agrandar / Un gráfico del rendimiento de Gemma proporcionado por Google. Google dice que Gemma supera a Meta’s Llama 2 en varios puntos de referencia.

Debido a una menor capacidad y altas tasas de confabulación, los LLM de peso abierto más pequeños se han parecido más a demostraciones tecnológicas hasta hace poco, ya que algunos más grandes han comenzado a igualar los niveles de rendimiento de GPT-3.5. Aún así, los expertos consideran que los modelos de IA de peso abierto y fuente disponible son pasos esenciales para garantizar la transparencia y la privacidad en los chatbots. Sin embargo, Google Gemma no es “código abierto”, ya que ese término generalmente se refiere a un tipo específico de licencia de software con pocas restricciones adjuntas.

En realidad, Gemma parece una jugada llamativa para igualar a Meta, que ha dado mucha importancia al lanzamiento de modelos de peso abierto (como LLaMA y Llama 2) desde febrero del año pasado. Esa técnica se opone a modelos de IA como el GPT-4 Turbo de OpenAI, que sólo está disponible a través de la aplicación ChatGPT y una API en la nube y no se puede ejecutar localmente. A informe de reuters on Gemma se centra en el ángulo Meta y supone que Google espera atraer más desarrolladores a su IA de vértice plataforma en la nube.

Todavía no hemos utilizado a Gemma; sin embargo, Google afirma que el modelo 7B supera a los modelos Llama 2 7B y 13B de Meta en varios puntos de referencia para matemáticas, generación de código Python, conocimiento general y tareas de razonamiento de sentido común. Está disponible hoy a través de Kaggleuna plataforma comunitaria de aprendizaje automático, y abrazando la cara.

En otras noticias, Google vinculó el lanzamiento de Gemma con un “Kit de herramientas de IA generativa responsable“, que Google espera que ofrezca orientación y herramientas para desarrollar lo que la compañía llama aplicaciones de IA “seguras y responsables”.

Leave a Reply

Your email address will not be published. Required fields are marked *