El misterioso modelo de IA "gpt2-chatbot" aparece de repente y confunde a los expertos

El domingo, comenzó a correr la voz en las redes sociales sobre un nuevo chatbot misterioso llamado “gpt2-chatbot” que apareció en LMSYS Chatbot Arena. Algunas personas especulan que puede ser una versión de prueba secreta del próximo modelo de lenguaje grande (LLM) GPT-4.5 o GPT-5 de OpenAI. La versión paga de ChatGPT actualmente funciona con GPT-4 Turbo.

Actualmente, el nuevo modelo sólo está disponible para su uso a través de Sitio web de Chatbot Arena, aunque de forma limitada. En el modo de arena “lado a lado” del sitio, donde los usuarios pue den seleccionar intencionalmente el modelo, gpt2-chatbot tiene un límite de velocidad de ocho consultas por día, lo que limita drásticamente la capacidad de las personas para probarlo en detalle.

Hasta ahora, gpt2-chatbot ha inspirado muchos rumores en línea, incluido el de que podría ser el lanzamiento sigiloso de una versión de prueba de GPT-4.5 o incluso GPT-5—o tal vez un nueva versión de 2019 GPT-2 que ha sido entrenado usando nuevas técnicas. Nos comunicamos con OpenAI para hacer comentarios, pero no recibimos una respuesta al momento de esta publicación. El lunes por la noche, el director ejecutivo de OpenAI, Sam Altman, aparentemente dejó caer una pista al tuiteando

“Tengo debilidad por gpt2”.

Una captura de pantalla del LMSYS Chatbot Arena — Agrandar / Una captura de pantalla de la página “lado a lado” de LMSYS Chatbot Arena que muestra “gpt2-chatbot” enumerado entre los modelos para prueba. (Resaltado rojo agregado por Ars Technica).

Benj Edwards

Primeros informes del modelo. apareció por primera vez en 4chan, luego difundido en las plataformas de redes sociales como Xcon bombo publicitario siguiéndole no muy lejos. “No sólo parece mostrar un razonamiento increíble, sino que también responde correctamente a preguntas de IA notoriamente desafiantes con un tono mucho más impresionante”. escribió El desarrollador de inteligencia artificial Pietro Schirano habla sobre X. Pronto, aparecieron hilos en Reddit reclamando que el nuevo modelo tenía habilidades asombrosas que superaban a todos los demás LLM en la Arena.

Intrigados por los rumores, decidimos probar el nuevo modelo nosotros mismos, pero no quedamos impresionados. Cuando se le preguntó acerca de “Benj Edwards”, el modelo reveló algunos errores y un lenguaje incómodo en comparación con la producción del GPT-4 Turbo. Una solicitud de cinco chistes originales sobre papás se quedó corta. Y el gpt2-chatbot no pasó decisivamente nuestra prueba “magenta”. (“¿El color se llamaría ‘magenta’ si la ciudad de Magenta no existiera?”)

Un resultado de gpt2-chatbot para “¿Quién es Benj Edwards?” en LMSYS Chatbot Arena. Errores y rarezas resaltados en rojo.

Benj Edwards
Un resultado de gpt2-chatbot para “Escribe 5 chistes originales sobre papá” en LMSYS Chatbot Arena.

Benj Edwards
Un resultado de gpt2-chatbot para “¿El color se llamaría ‘magenta’ si la ciudad de Magenta no existiera?” en LMSYS Chatbot Arena.

Benj Edwards

Entonces, sea lo que sea, probablemente no sea GPT-5. Hemos visto a otras personas llegar a la misma conclusión después de pruebas adicionales, diciendo que el nuevo chatbot misterioso no parece representar un gran salto de capacidad más allá de GPT-4. “GRAMOpt2-chatbot es bueno. realmente bueno,” escribió Matt Shumer, director ejecutivo de HyperWrite, sobre X. “Pero si esto es gpt-4.5, estoy decepcionado”.

Aún así, las huellas digitales de OpenAI parecen estar en todo el nuevo robot. “Creo que bien podría ser una vista previa sigilosa de algo de OpenAI”, dijo el investigador de IA Simon Willison a Ars Technica. Pero no sabe qué es exactamente “gpt2”. Después de examinar las especulaciones en línea, parece que nadie, aparte de su creador, sabe con precisión cuál es el modelo.

Willison tiene descubrió el indicador del sistema para el modelo de IA, que afirma estar basado en GPT-4 y fabricado por OpenAI. Pero como Willison anotado en un tweet, eso no es garantía de procedencia porque “el objetivo de un mensaje del sistema es influir en el modelo para que se comporte de cierta manera, no darle información veraz sobre sí mismo”.

El misterioso modelo de IA “gpt2-chatbot” aparece de repente y confunde a los expertos

Leave a Reply Cancel reply