Anthropic establece un nuevo estándar de oro: su movimiento, OpenAI

Anthropic establece un nuevo estándar de oro: su movimiento, OpenAI

antrópico, una startup nacida de desertores de OpenAI, afirma que su nuevo chatbot, Claude 3, ha abierto nuevos caminos para el mundo de la IA. El chatbot de IA actualizado, lanzado el lunes, supera ChatGPT y Google Géminis modelos más avanzados, coronando potencialmente a un nuevo rey en el mundo de la IA. Anthropic lanzó tres niveles (Opus, Sonnet y Haiku) que van de mayor a menor capacidad.

“Opus nos muestra los límites exteriores de lo que es posible con la IA generativa”, dijo Anthropic en un entrada en el blog Lunes. “Claude 3 Opus es nuestro modelo más inteligente, con el mejor rendimiento del mercado en tareas altamente complejas. Puede navegar por indicaciones abiertas y escenarios invisibles con notable fluidez y comprensión humana”.

El lanzamiento de Claude 3 por parte de Anthropic reafirma a la startup, dirigida por los hermanos Dario y Daniela Amodei, como líder mundial en el espacio de la IA. Los nuevos modelos están equipados con el “IA constitucional”, cuyo objetivo es hacer que los chatbots sean menos dañinos. Claude 3, sin embargo, tiene tasas de rechazo más bajas en cuestiones controvertidas que los modelos anteriores y ahora tiene un precio competitivo bajo.

Claude 3 supera notablemente a ChatGPT y Gemini en codificación, uno de los primeros casos de uso más populares de la IA. Claude Opus obtiene una tasa de éxito del 85 % en codificación de disparo cero, en comparación con el 67 % de GPT-4 y el 74 % de Gemini. Claude también supera a la competencia en lo que respecta a razonamiento, resolución de problemas matemáticos y conocimientos básicos (MMLU). Sin embargo, Sonnet y Haiku, que son más baratos y rápidos, también compiten con OpenAI y con los modelos más avanzados de Google.

Funciones como la IA constitucional de Anthropic se están volviendo cada vez más importantes en el espacio. El mes pasado, el director ejecutivo de Google, Sundar Pichai hizo una pausa a Géminis por sus controvertidas respuestas

en torno a la raza, que calificó de “completamente inaceptable”.

En las primeras pruebas de Gizmodo con Claude Opus (con un precio de 20 dólares al mes), el chatbot de IA se siente comparable a un líder de la industria. El chatbot es capaz de realizar razonamientos de alto nivel y resolver problemas. Claudio 3 también navega por cuestiones controvertidas con más gracia que Gemini y ChatGPT.

Anthropic, sin embargo, tiene algunas limitaciones que otras empresas no tienen. La empresa no ofrece generación de imágenes como algunos de sus competidores, que se está convirtiendo en un estándar para los chatbots de IA. Claude tampoco tiene conocimiento en vivo o la capacidad de navegar por la web. Su fecha límite de datos es agosto de 2023.

La baja tasa de rechazo de Claude 3 se nota cuando se utiliza el chatbot. A diferencia de Gemini, el chatbot de Anthropic puede responder con facilidad preguntas difíciles sobre raza, acción afirmativa y temas políticos candentes. Si bien el chatbot no emitirá una opinión, hace un mejor trabajo que otros al dar una respuesta equilibrada. Estas salvaguardias fueron un enfoque central para los fundadores de Anthropic and la razón principal por la que dejaron OpenAI.

El mundo de las startups de IA es cada vez más competitivo. Anthropic se asoció con Amazon y ofrece sus servicios de chatbot de IA a través de Amazon Bedrock, la plataforma de IA del gigante minorista para sus servicios web de Amazon. La semana pasada, Microsoft anunció una nueva asociación con la startup francesa de IA Mistralmientras continúa su asociación mucho más amplia con OpenAI.

Anthropic envió un mensaje a la competencia con el lanzamiento de Claude, destronando a OpenAI como líder desde hace mucho tiempo en el mundo de la IA. Ha pasado aproximadamente un año desde que OpenAI lanzó ChatGPT-4, por lo que puede que no pase mucho tiempo hasta que obtengamos una respuesta a Claude 3 con el tan esperado GPT-5.

Leave a Reply

Your email address will not be published. Required fields are marked *