Google DeepMind utilizó un modelo de lenguaje grande para descubrir nuevas matemáticas

FunSearch (llamado así porque busca funciones matemáticas, no porque sea divertido) continúa una racha de descubrimientos en matemáticas fundamentales e informática que DeepMind ha realizado utilizando IA. Primero, AlphaTensor encontró una manera de acelerar un cálculo en el corazón de muchos tipos diferentes de código, batiendo un récord de 50 años. Luego, AlphaDev encontró formas de hacer que los algoritmos clave utilizados billones de veces al día se ejecutaran más rápido.

Sin embargo, esas herramientas no utilizaron grandes modelos de lenguaje. Construidos sobre la IA AlphaZero de DeepMind, ambos resolvieron problemas matemáticos tratándolos como si fueran rompecabezas de Go o ajedrez. El problema es que están atrapados en sus carriles, dice Bernardino Romera-Paredes, un investigador de la compañía que trabajó tanto en AlphaTensor como en FunSearch: “AlphaTensor es excelente en la multiplicación de matrices, pero básicamente nada más”.

FunSearch toma un rumbo diferente. Combina un modelo de lenguaje grande llamado Codey, una versión de PaLM 2 de Google que está optimizado en código de computadora, con otros sistemas que rechazan respuestas incorrectas o sin sentido y vuelven a insertar las buenas.

“Para ser honesto, tenemos hipótesis, pero no sabemos exactamente por qué funciona”, dice Alhussein Fawzi, ci entífico investigador de Google DeepMind. “Al principio del proyecto no sabíamos si esto funcionaría”.

Los investigadores comenzaron esbozando el problema que querían resolver en Python, un lenguaje de programación popular. Pero omitieron las líneas del programa que especificarían cómo resolverlo. Ahí es donde entra en juego FunSearch. Hace que Codey complete los espacios en blanco; de hecho, sugiere código que resolverá el problema.

Luego, un segundo algoritmo verifica y califica lo que se le ocurre a Codey. Las mejores sugerencias, incluso si aún no son correctas, se guardan y se devuelven a Codey, que intenta completar el programa nuevamente. “Muchos serán absurdos, algunos serán sensatos y unos pocos estarán verdaderamente inspirados”, dice Kohli. “Tomas los que están realmente inspirados y dices: ‘Está bien, toma estos y repite’”.

Después de un par de millones de sugerencias y algunas docenas de repeticiones del proceso general, que tomó algunos días, FunSearch pudo generar un código que produjo una solución correcta y previamente desconocida para el problema del conjunto de límites, que implica encontrar el tamaño más grande. de un determinado tipo de conjunto. Imagínese trazar puntos en papel cuadriculado. El problema del límite máximo es como tratar de calcular cuántos puntos puedes colocar sin que tres de ellos formen una línea recta.

Es un nicho súper específico, pero importante. Los matemáticos ni siquiera se ponen de acuerdo sobre cómo resolverlo y mucho menos sobre cuál es la solución. (También está relacionado con la multiplicación de matrices, el cálculo que AlphaTensor encontró una manera de acelerar). Terence Tao de la Universidad de California, Los Ángeles, que ha ganado muchos de los premios más importantes en matemáticas, incluida la Medalla Fields, llamada problema de establecimiento de límites “quizás mi pregunta abierta favorita” en un informe de 2007 entrada en el blog.

Leave a Reply Cancel reply