Una IA que pueda jugar Goat Simulator es un paso hacia una IA más útil

Una IA que pueda jugar Goat Simulator es un paso hacia una IA más útil

Al entrenar sistemas de IA, los juegos son un buen sustituto para las tareas del mundo real. “Un agente de juego general podría, en principio, aprender mucho más sobre cómo navegar por nuestro mundo que cualquier cosa en un solo entorno”, dice Michael Bernstein, profesor asociado de ciencias de la computación en la Universidad de Stanford, que no formó parte de la investigación.

“Uno podría imaginar que un día, en lugar de tener agentes sobrehumanos contra los cuales jugar, podríamos tener agentes como SIMA jugando junto a ti en juegos contigo y con tus amigos”, dice Tim Harley, ingeniero de investigación de Google DeepMind que formó parte del proyecto. equipo que desarrolló el agente.

El equipo entrenó a SIMA con muchos ejemplos de humanos jugando videojuegos, tanto individualmente como en colaboración, junto con entradas de teclado y mouse y anotaciones de lo que hicieron los jugadores en el juego, dice Frederic Besse, ingeniero de investigación de Google DeepMind.

Luego utilizaron una técnica de inteligencia artificial llamada aprendizaje por imitación para enseñar al agente a jugar como lo harían los humanos. SIMA puede seguir 600 instrucciones básicas, como “Girar a la izquierda”, “Subir la escalera” y “Abrir el mapa”, cada una de las cuales se puede completar en menos de aproximadamente 10 segundos.

El equipo descubrió que un agente de SIMA que estaba capacitado en muchos juegos era mejor que un agente que aprendía a jugar solo uno. Esto se debe a que pudo aprovechar los conceptos compartidos entre los juegos para aprender mejores habilidades y mejorar la ejecución de instrucciones, dice Besse.

“Esta es nuevamente una propiedad clave realmente interesante, ya que tenemos un agente que puede jugar juegos que nunca antes había visto”, dice.

Ver este tipo de transferencia de conocimiento entre juegos es un hito importante para la investigación de la IA, afirma Paulo Rauber, profesor de Inteligencia artificial en la Universidad Queen Mary de Londres.

La idea básica de aprender a ejecutar instrucciones basándose en ejemplos proporcionados por humanos podría conducir a sistemas más potentes en el futuro, especialmente con conjuntos de datos más grandes, afirma Rauber. El conjunto de datos relativamente limitado de SIMA es lo que está frenando su desempeño, afirma.

Leave a Reply

Your email address will not be published. Required fields are marked *