GPT-5 podría llegar este verano como una actualización "materialmente mejor" de ChatGPT

Un logotipo de OpenAI brillante sobre un fondo azul.

Cuando OpenAI lanzó su modelo de IA GPT-4 hace un año, creó una ola de inmenso revuelo y pánico existencial por su capacidad para imitar la comunicación y composición humana. Desde entonces, la pregunta más importante en IA sigue siendo la misma: ¿Cuándo saldrá GPT-5? Durante entrevistas y apariciones en los medios de todo el mundo, al director ejecutivo de OpenAI, Sam Altman, le hacen con frecuencia esta pregunta, y por lo general da una respuesta tímida o evasivaa veces junto con promesas de cosas maravillosas por venir.

Según un nuevo informe de Business Insider, se espera que OpenAI lance GPT-5, una versión mejorada del modelo de lenguaje de IA que impulsa ChatGPT, en algún momento a mediados de 2024, y probablemente durante el verano. Dos fuentes anónimas familiarizadas con la compañía revelaron que algunos clientes empresariales recibieron recientemente demostraciones de GPT-5 y mejoras relacionadas con ChatGPT.

Un director ejecutivo que vio recientemente una versión de GPT-5 la describió como “realmente buena” y “materialmente mejor”, y OpenAI demostró el nuevo modelo utilizando casos de uso y datos exclusivos de su empresa. El CEO también insinuó otras capacidades inéditas del modelo, como la capacidad de lanzar agentes de IA desarrollados por OpenAI para realizar tareas automáticamente.

Preguntamos a los representantes de OpenAI sobre la fecha de lanzamiento de GPT-5 y el informe de Business Insider. Respondieron que no tenían ningún comentario en particular, pero incluyeron un fragmento de una transcripción del libro de Altman. aparición reciente en el podcast de Lex Fridman.

Lex Fridman (01:06:13) Entonces, ¿cuándo volverá a salir GPT-5?
Sam Altman (01:06:15) No lo sé. Esa es la respuesta honesta.
Lex Fridman (01:06:18) Oh, esa es la respuesta honesta. Parpadea dos veces si es este año.
Sam Altman (01:06:30) Lanzaremos un modelo nuevo e increíble este año. No sé cómo lo llamaremos.
Lex Fridman (01:06:36) Entonces la pregunta es: ¿cuál es la forma en que lanzamos esto?
Sam Altman (01:06:41) Lanzaremos muchas cosas diferentes en los próximos meses. Creo que sería genial. Creo que antes de hablar de un modelo similar a GPT-5 llamado así, o no llamado así, o un poco peor o un poco mejor de lo que esperarías de un GPT-5, creo que tenemos muchas otras cosas importantes para publicar primero.

En esta conversación, Altman parece insinuar que la compañía está preparada para lanzar un modelo importante de IA este año, pero si se llamará “GPT-5” o se considerará una actualización importante de GPT-4 Turbo (o tal vez una actualización incremental). como GPT-4.5) está en el aire.

Al igual que su predecesor, se espera que GPT-5 (o como se llame) sea un modelo de lenguaje grande (LLM) multimodal que pueda aceptar texto o entrada visual codificada (llamada “mensaje”). Y al igual que GPT-4, GPT-5 será un modelo de predicción del siguiente token, lo que significa que generará su mejor estimación del siguiente token más probable (un fragmento de una palabra) en una secuencia, lo que permite tareas como completar una oración o escribir un código. Cuando se configuran de una manera específica, los modelos GPT pueden impulsar aplicaciones de chatbot conversacionales como ChatGPT.

OpenAI lanzó GPT-4 en marzo de 2023 como una actualización de su predecesor más importante, GPT-3, que surgió en 2020 (y GPT-3.5 llegará a finales de 2022). En noviembre pasado, OpenAI lanzó GPT-4 Turbo, que redujo drásticamente los costos de inferencia (ejecución) del mejor modelo de IA de OpenAI, pero ha estado plagado de acusaciones de “pereza” donde el modelo a veces se niega a responder indicaciones o completar proyectos de codificación según lo solicitado. OpenAI ha intentado solucionar el problema de la pereza varias veces.

Los LLM como los desarrollados por OpenAI se capacitan en conjuntos de datos masivos extraídos de Internet y con licencia de compañías de medios, permitiéndoles responder a las indicaciones de los usuarios de forma humana. Sin embargo, la calidad de la información proporcionada por el modelo puede variar según los datos de entrenamiento utilizados y también según la tendencia del modelo a confabular información. Si GPT-5 puede mejorar la generalización (su capacidad para realizar tareas novedosas) y al mismo tiempo reducir lo que comúnmente se llama “alucinaciones” en la industria, probablemente representará un avance notable para la empresa.

Según el informe, OpenAI todavía está entrenando GPT-5 y, una vez completado, el modelo se someterá a pruebas de seguridad internas y a más “equipos rojos” para identificar y abordar cualquier problema antes de su lanzamiento público. La fecha de lanzamiento podría retrasarse dependiendo de la duración del proceso de prueba de seguridad.

Por supuesto, las fuentes del informe podrían estar equivocadas y GPT-5 podría lanzarse más tarde por motivos distintos a las pruebas. Entonces, considere esto como un rumor fuerte, pero esta es la primera vez que vemos una posible fecha de lanzamiento para GPT-5 de una fuente confiable. Además, ahora sabemos que, según se informa, GPT-5 está lo suficientemente completo como para someterse a pruebas, lo que significa que su ejecución de entrenamiento principal probablemente esté completa. Es probable que se realicen más mejoras.

GPT-5 podría llegar este verano como una actualización “materialmente mejor” de ChatGPT

Leave a Reply Cancel reply