Tecnología lA que ya puede ganar a los humanos en juegos

 27-07-2019
A Amigon
   
Foto: Foto: cortesía de deepmind.com

Foto: Foto: cortesía de deepmind.com

Las investigaciones que apuntan a una Inteligencia Artificial (IA) con un procesamiento complejo capaz de resolver problemas a gran velocidad, buscan poner a prueba a estas nuevas tecnologías. Uno de estos métodos es jugar en partidas de juegos de mesa o dejarlas participar en MMORPG (juegos de rol y multijugador en línea), para así aprendan de las distintas habilidades humanas para resolver conflictos comunes.

Una de las primeras victorias obtenidas para la IA fue AlphaZero, propiedad de DeepMind, una filial británica de Alphabet. El programa aprendió a jugar ajedrez, shogi y Go sólo con las reglas básicas; a través de 'aprendizaje por refuerzo', la IA analizó las partidas gracias a una profunda red neuronal y terminó ganando contra las demás IA en esos juegos como Stockfish o Deep Blue.

DeepMind también se encargó de la primera IA en ganar una partida de un MMORPG llamado Quake III Arena, Capture the flag. Se trata de un género de videjuegos online de disparadores con miles de jugadores al mismo tiempo; el programa logró vencer sólo con la experiencia obtenida jugando y los datos analizados de la pantalla.

Estos resultados han sido posibles gracias al aprendizaje por refuerzo o reinforcement learning. Esta tecnología genera millones de partidas en un proceso de prueba y error, por cada error que sucede toma nota y 'aprende' para mejorar su estrategia. Una vez entrenada para saber las mejores jugadas, en la practica las IA analizan la situación y generan una respuesta de acuerdo a lo aprendido, diferente de programas pasados que debían revisar una gran cantidad de datos con todos los movimientos posibles.

Con el mismo proceso fue programado Pluribus, un bot que venció por primera vez en partidas de Texas Hold'em a humanos profesionales. La dificultad de un juego de poker es diferente al de las partidas de ajedrez o shogi, en ellas las IA debían buscar el siguiente movimiento con base en los datos almacenados anterioremente; mientras que Pluribus necesitaba tener en cuenta no sólo los movimientos o reglas, sino también las cartas ya tiradas y las faltantes por salir.

Pluribus y su antecesora, Libratus, son IA que tienen esta mayor complejidad a la hora de jugar. Lograr estrategias disponibles necesitó de entrenarse por 12,400 horas en 64 procesadores. Luego de tener esta información, sólo necesitó dos unidades centrales de procesamiento (CPU) para analizar la partida, figurar un movimiento y luego 'pensar' otro mejor para llevar la partida a la victoria.

Sin embargo, a pesar de los avances se necesita de una habilidad más general para que una IA pueda competir en diversos juegos y no sólo dominar uno, según Julian Togelius, estudiante de IA en la Universidad de Nueva York, pero la ventaja y desventaja es que "hay mucho territorio sin explorar".




DESCARGA LA NOTA  SÍGUENOS EN GOOGLE NEWS