Por qué el último modelo de lenguaje grande de Meta solo sobrevivió tres días en línea

Por qué el último modelo de lenguaje grande de Meta solo sobrevivió tres días en línea

El equipo de Meta detrás de Galactica argumenta que los modelos de lenguaje son mejores que los motores de búsqueda. “Creemos que esta será la próxima interfaz de cómo los humanos acceden al conocimiento científico”, dijeron los investigadores. escribe.

Esto se debe a que los modelos de lenguaje pueden “potencialmente almacenar, combinar y razonar sobre” información. Pero ese “potencialmente” es crucial. Es una admisión codificada de que los modelos de lenguaje aún no pueden hacer todas estas cosas. Y es posible que nunca puedan hacerlo.

“Los modelos lingüísticos no tienen realmente conocimientos más allá de su capacidad para capturar patrones de cadenas de palabras y escupirlas de manera probabilística”, dice Shah. “Da una falsa sensación de inteligencia”.

Gary Marcus, científico cognitivo de la Universidad de Nueva York y crítico vocal del aprendizaje profundo, dio su opinión en una publicación de Substack titulada “Algunas palabras sobre tonterías”, que dice que la capacidad de los grandes modelos de lenguaje para imitar el texto escrito por humanos no es más que “una hazaña superlativa de las estadísticas”.

Y, sin embargo, Meta no es la única empresa que defiende la idea de que los modelos de lenguaje podrían reemplazar a los motores de búsqueda. Durante los últimos años, Google ha estado promocionando su modelo de lenguaje PaLM como una forma de buscar información.

Es una idea tentadora. Pero sugerir que el texto similar al humano que generan tales modelos siempre contendrá información confiable, como parece que Meta hizo en su promoción de Galáctica, es imprudente e irresponsable. Fue un error no forzado.

Leave a Reply

Your email address will not be published. Required fields are marked *