La inteligencia artificial consigue dominar Stratego, el juego de información imperfecta

Juego de mesa Stratego. / Deep Mind

A diferencia de otros juegos ya controlados por la inteligencia artificial, como el ajedrez o el Go, en los que los jugadores pueden ver todas las piezas del juego y crear de este modo estrategias, los jugadores de Stratego tienen que aprender a manejar la falta de certeza. Es un juego mucho más parecido al póker, en el que cada jugador conoce sus propias cartas pero no las del oponente.

Para jugar bien a Stratego con IA es necesario encontrar un algoritmo que tenga en cuenta las dudas del jugador. La gran cantidad de resultados posibles tiene como consecuencia que los algoritmos que funcionan bien en juegos de información perfecta, e incluso aquellos que funcionan bien para el póker, no se puedan aplicar a este juego. La complejidad es de muchos órdenes de magnitud mayor: 10^66 en Stratego comparado con 10^6 en Texas Hold’em para dos jugadores.

DeepNash Ganó contra todos los bots y logró un nivel de juego altamente competitivo contra jugadores humanos

“En Stratego, la planificación es casi imposible, dada la cantidad de incertidumbre sobre la que los jugadores tienen que razonar. En este trabajo, tomamos otro camino y aprendimos directamente una estrategia para cada situación dada del tablero, usando una combinación de teoría de juegos y aprendizaje de refuerzo profundo”, explica a SINC Julien Perolat, coautor principal del estudio e investigador de DeepMind.

Para desarrollar DeepNash, el programa detrás del logro, Perolat y sus colegas combinaron el algoritmo R-NaD, de aprendizaje por refuerzo, con una arquitectura de red neuronal profunda para lograr una estrategia de juego competitiva.

El programa se probó contra varios bots Stratego de última generación y contra jugadores humanos expertos. Ganó contra todos los bots y logró un nivel de juego altamente competitivo contra jugadores humanos con nivel de experto en Gravon, la plataforma en línea más grande de jugadores de Stratego.

Los juegos como campo de experimentación

El propósito de estudiar juegos con IA no siempre es ganar, sino probar nuevos métodos y enfoques que podrían ser útiles para problemas del mundo real.

“Es poco probable que los sistemas de IA sean imbatibles en juegos que manejan incertidumbre. Para ganar en un juego de información imperfecta, normalmente se necesita una combinación de suerte y habilidad. E incluso si un programa de inteligencia artificial hubiera aprendido una estrategia perfecta –digamos un equilibrio de Nash– aún podría perder por tener mala suerte”, explica Karl Tuyls, coautor principal del estudio e investigador de DeepMind.

“Los juegos son el entorno perfecto para estudiar los sistemas avanzados de inteligencia artificial. Permiten desarrollar y probar algoritmos de IA más inteligentes y flexibles de manera rápida y eficiente, y también ofrecen comentarios instantáneos sobre cómo lo estamos haciendo a través de las puntuaciones”, explica Perolat.

Todavía quedan juegos que la IA no ha podido dominar. Según los investigadores, un ejemplo podría ser bridge, un juego de cuatro jugadores en el que se compite por parejas. “En este juego se han logrado algunos avances en los últimos años con versiones simplificadas, pero sigue siendo difícil para una IA dominar el juego completo,” añade Perolat.

El programa plantea posibilidades para que los sistemas de IA tengan aplicaciones en el mundo real en entornos caracterizados por la información imperfecta. Esto se debe a que puede manejar grandes cantidades de incertidumbre en forma de información y antes no era posible / Karl Tuyls, coautor del trabajo e investigador de DeepMInd

IA para mejorar el tráfico

Según los autores, este avance podría ayudar a desbloquear nuevas aplicaciones de la IA en dominios que cuentan con una gran cantidad de participantes humanos y donde no se tiene información sobre la intención de los usuarios o lo que está ocurriendo en el entorno. Como por ejemplo, para optimizar la gestión del tráfico a gran escala, reducir los tiempos de viaje de los conductores y las emisiones de los vehículos.

“Creemos que DeepNash plantea nuevas posibilidades para que los sistemas de IA tengan aplicaciones en el mundo real en entornos caracterizados por la información imperfecta. Esto se debe a que puede manejar grandes cantidades de incertidumbre en forma de información y antes no era posible”, explica Karl Tuyls.

Referencia:

Perolat, Julien; De Vylder, Bart; et al. “Mastering the game of Stratego with model-free multiagent reinforcement learning”. Science (2022)

Acceda a la versión completa del contenido

La inteligencia artificial consigue dominar Stratego, el juego de información imperfecta

Alejandro Muñoz Fernández

Siguiente ¿La FIFA y Catar se vengan de Alemania? »

Anterior « El Ibex avanza un 0,53% y cierra por encima de los 8.400 puntos gracias a la Fed

Publicado por

Alejandro Muñoz Fernández

Etiquetas: GoogleInnovacionInteligencia Artificial

3 años hace

Mujeres con discapacidad y mayores denuncian brechas laborales y de pensiones en el 8M

El 8M vuelve a situar en el centro del debate público las desigualdades estructurales que…

7 horas hace

Mercados

El petróleo Brent podría superar los 100 dólares si se bloquea el estrecho de Ormuz

Los mercados energéticos siguen con atención la evolución del conflicto en Oriente Medio, ya que…

8 horas hace

Mercados

Los bancos centrales reducen el peso del dólar y elevan sus reservas de oro

El sistema de reservas de los bancos centrales cumple una función clave: garantizar liquidez suficiente…

10 horas hace

Tecnología

La violencia digital contra las mujeres crece con la inteligencia artificial

La violencia hacia las mujeres no solo se manifiesta en el ámbito físico o social,…

10 horas hace

Mercados

El franco suizo se dispara como refugio global y Suiza estudia intervenir en el mercado

La escalada del conflicto entre EEUU, Israel e Irán ha reforzado el atractivo del franco…

10 horas hace

Tecnología

La ONU alerta del riesgo de integrar inteligencia artificial en sistemas nucleares

El debate sobre el uso de la IA en el ámbito nuclear ha ganado fuerza…

11 horas hace

La inteligencia artificial consigue dominar Stratego, el juego de información imperfecta

Los juegos como campo de experimentación

Acceda a la versión completa del contenido

Entrada Relacionada

Entradas recientes

Mujeres con discapacidad y mayores denuncian brechas laborales y de pensiones en el 8M

El petróleo Brent podría superar los 100 dólares si se bloquea el estrecho de Ormuz

Los bancos centrales reducen el peso del dólar y elevan sus reservas de oro

La violencia digital contra las mujeres crece con la inteligencia artificial

El franco suizo se dispara como refugio global y Suiza estudia intervenir en el mercado

La ONU alerta del riesgo de integrar inteligencia artificial en sistemas nucleares