Cómo se compara la nueva Grok AI de Elon Musk con la competencia

Cómo se compara la nueva Grok AI de Elon Musk con la competencia

Casi dos semanas después de que la startup xAI de Elon Musk lanzara al público el modelo de IA detrás de Grok, su chatbot de IA está listo para recibir una actualización.

La empresa Anunciado Grok-1.5 el jueves, afirmando que su último modelo puede comprender documentos más largos, manejar indicaciones más complejas y realizar razonamientos más avanzados.

Si bien Grok-1.5 parece ser un paso adelante con respecto al 1.0 original con mejoras en programación y capacidades matemáticas, la publicación del anuncio muestra que todavía está por detrás de Gemini Pro 1.5 AI de Google, GPT-4 de OpenAI y Claude 3 Opus de Anthropic en algunas pruebas de referencia. y supera a OpenAI en una prueba clave de HumanEval.

Relacionado: Conozca a Grok: Elon Musk presenta un chatbot de IA “agudo” lleno de “sarcasmo” y “humor”

Grok-1.5 logró una puntuación más alta que GPT-4 evaluación humana Punto de referencia que consta de 164 problemas de programación desafiantes que no están incluidos en los datos de entrenamiento del modelo de IA. GPT-4 obtuvo una puntuación del 67%, Gemini Pro 1.5 logró un 71,9%, mientras que Grok-1.5 recibió un 74,1%.

La compañía xAI de Elon Musk lanzará una nueva versión del chatbot Grok AI, un competidor de ChatGPT. Foto de Jaap Arriens/NurPhoto vía Getty Images.

Con una puntuación del 81,3% en el MMLU En la prueba, que cubre el conocimiento de 57 temas desde el nivel básico hasta el avanzado, Grok-1.5 obtuvo un puntaje cercano al de Google Gemini (83,7%).

Con una puntuación del 50,6%, también se acercó a la puntuación del GPT-4 del 52,9%. MATEMÁTICAS Test, un punto de referencia que cubre problemas de competencia de matemáticas desde la escuela primaria hasta la secundaria.

Relacionado: Elon Musk está demandando al fabricante de ChatGPT OpenAI, acusando a la empresa de trabajar “para maximizar las ganancias de MicrosoHeaven32 y no por el bien de la humanidad”.

Musk explicó en un viernes publicación en redes sociales que Grok 1.5 debería estar disponible la próxima semana en X, anteriormente Twitter.

El propietario de X tiene grandes expectativas para la próxima generación de Grok y escribe que el siguiente paso después de Grok-1.5 superará a la IA actualmente disponible “en todas las métricas”. Grok 2 está “ahora en entrenamiento”, escribió en la publicación.

Grok AI está actualmente solo disponible a aquellos con uno $16 por mes o suscripción Premium+ superior en X.

Musk demandó a OpenAI, un competidor de xAI, a principios de este mes, buscando un fallo judicial que obligaría a OpenAI a revelar públicamente la investigación y la tecnología detrás de su IA.

Leave a Reply

Your email address will not be published. Required fields are marked *