Google DeepMind entrenó a un robot para vencer a los humanos en tenis de mesa

Google DeepMind entrenó a un robot para vencer a los humanos en tenis de mesa

El sistema está lejos de ser perfecto. Aunque el robot de tenis de mesa pudo vencer a todos los oponentes humanos de nivel principiante a los que se enfrentó y al 55% de los que jugaban a nivel amateur, perdió todas las partidas contra jugadores avanzados. Aun así, es un avance impresionante.

“Hace unos meses, ya habíamos previsto que, de manera realista, el robot no podría ganar contra personas con las que no hubiera jugado antes. El sistema sin duda superó nuestras expectativas”, afirma Pannag Sanketi, ingeniero de software sénior de Google DeepMind, que dirigió el proyecto. “La forma en que el robot superó incluso a oponentes fuertes fue alucinante”.

Y la investigación no es solo diversión y juegos. De hecho, representa un paso hacia la creación de robots que puedan realizar tareas útiles con d estreza y seguridad en entornos reales como hogares y almacenes, que es un objetivo de larga data de la comunidad robótica. El enfoque de Google DeepMind para entrenar máquinas es aplicable a muchas otras áreas del campo, dice Lerrel Pinto, un investigador de ciencias de la computación de la Universidad de Nueva York que no trabajó en el proyecto.

“Me encanta ver sistemas robóticos trabajando con y alrededor de humanos reales, y este es un ejemplo fantástico de ello”, afirma. “Puede que no sea un actor fuerte, pero los ingredientes básicos están ahí para seguir mejorando y, finalmente, lograrlo”.

Para convertirse en un jugador competente de tenis de mesa, los humanos necesitan una excelente coordinación mano-ojo, la capacidad de moverse rápidamente y tomar decisiones rápidas para reaccionar ante su oponente, todo lo cual son desafíos importantes para los robots. Los investigadores de Google DeepMind utilizaron un enfoque de dos partes para entrenar al sistema para que imitara estas habilidades: utilizaron simulaciones por computadora para entrenar al sistema para que dominara sus habilidades de golpeo; luego lo afinaron utilizando datos del mundo real, lo que le permite mejorar con el tiempo.