La IA de juego de DeepMind acaba de batir un récord de 50 años en informática

La IA de juego de DeepMind acaba de batir un récord de 50 años en informática

“Este es un resultado realmente sorprendente”, dice François Le Gall, matemático de la Universidad de Nagoya en Japón, que no participó en el trabajo. “La multiplicación de matrices se usa en todas partes en la ingeniería”, dice. “Cualquier cosa que quieras resolver numéricamente, normalmente usas matrices”.

A pesar de la ubicuidad del cálculo, todavía no se entiende bien. Una matriz es simplemente una cuadrícula de números, que representa cualquier cosa que desee. Multiplicar dos matrices normalmente implica multiplicar las filas de una con las columnas de la otra. La técnica básica para resolver el problema se enseña en la escuela secundaria. “Es como el ABC de la computación”, dice Pushmeet Kohli, jefe del equipo AI for Science de DeepMind.

Pero las cosas se complican cuando intentas encontrar un método más rápido. “Nadie conoce el mejor algoritmo para resolverlo”, dice Le Gall. “Es uno de los mayores problemas abiertos en la informática”.

Esto se debe a que hay más formas de multiplicar dos matrices que átomos en el universo (10 elevado a 33, en algunos de los casos que analizaron los investigadores). “La cantidad de acciones posibles es casi infinita”, dice Thomas Hubert, ingeniero de DeepMind.

El truco consistía en convertir el problema en una especie de juego de mesa tridimensional, llamado TensorGame. El tablero representa el problema de multiplicación a resolver, y cada movimiento representa el siguiente paso para resolver ese problema. La serie de movimientos realizados en un juego, por lo tanto, representa un algoritmo.

Los investigadores entrenaron una nueva versión de AlphaZero, llamada AlphaTensor, para jugar este juego. En lugar de aprender la mejor serie de movimientos para hacer en Go o ajedrez, AlphaTensor aprendió la mejor serie de pasos para hacer al multiplicar matrices. Fue recompensado por ganar el juego en el menor número de movimientos posible.

“Transformamos esto en un juego, nuestro tipo de marco favorito”, dice Hubert, quien fue uno de los investigadores principales de AlphaZero.

Leave a Reply

Your email address will not be published. Required fields are marked *