Las plataformas de inteligencia artificial de DeepMind se han hecho famosas en todo el mundo en los últimos años gracias a su excelente dominio de juegos complejos y que requieren un uso intensivo del cerebro, como el ajedrez, el shogi y el go. Con el tiempo, gradualmente “evolucionaron”, derrotando a nuestros jugadores de carne y hueso con técnicas avanzadas de aprendizaje automático.
A principios de este año, DeepMind presentó una nueva versión de un modelo de IA creado específicamente para el juego de estrategia en tiempo real StarCraft 2 llamado AlphaStar. AlphaStar también ha heredado muy bien la tradición de sus mayores, lo que avergüenza a la gente con sus abrumadoras victorias sobre muchos de los mejores jugadores de StarCraft 2 del mundo en la actualidad.

Después de casi 10 meses de "cultivo", AlphaStar se ha convertido literalmente en el mejor "jugador" de StarCraft 2 del mundo. Más específicamente, el miércoles 30 de octubre, DeepMind publicó un nuevo estudio sobre AlphaStar en la revista Nature, detallando hasta dónde ha llegado este modelo de IA en el mundo de StarCraft 2, y lamenta informar a la comunidad de jugadores de StarCraft 2 que AlphaStar ahora obtuvo la calificación de Gran Maestro, lo que significa que este modelo de IA puede derrotar al 99,8% de todos los jugadores de StarCraft 2 en todo el mundo.
La pregunta aquí es por qué los investigadores están creando modelos de IA para un videojuego de nicho y qué puede enseñarnos este modelo de IA sobre la inteligencia artificial y la tecnología de aprendizaje automático.
Si no lo sabes, StarCraft 2 es un juego de estrategia en tiempo real donde los jugadores controlan uno de tres equipos (o "razas", en la jerga del juego). Cada raza posee atributos únicos y el jugador debe controlar un ejército de cientos de unidades en un mapa grande. Mientras administran recursos para construir unidades militares, los jugadores tendrán que atacar a los enemigos y defender su base simultáneamente. Con este tipo de juego, existen innumerables tácticas y estrategias, desde simples hasta complejas, que los jugadores pueden aplicar con el objetivo final de ganar.
La complejidad y profundidad del juego lo convierten en un desafío importante para la IA. A diferencia del ajedrez o del Go, en el mundo de StarCraft II los jugadores no pueden ver lo que están haciendo sus oponentes. Además, mientras que el ajedrez o el Go te permiten hacer una pausa y reflexionar sobre la estrategia, StarCraft II es un título "en tiempo real", por lo que una vez que comienza la partida, sólo importa la victoria o la derrota.

DeepMind sometió a AlphaStar a un régimen de entrenamiento bastante simple. Primero, vio casi un millón de repeticiones de los mejores jugadores para aprender estrategias y encontrar formas de imitarlos. Luego, AlphaStar "compitió" con otro modelo de IA de DeepMind para poder concluir qué estrategia daba los resultados más óptimos en una técnica llamada "aprendizaje por refuerzo" (aprendizaje por refuerzo). Este proceso entrena a la IA mostrándole que ganar es “bueno” y perder es “malo”.
De hecho, AlphaStar también posee algunas ventajas sobre los humanos. Por ejemplo, para una persona normal, existen muchos factores objetivos que pueden limitar la capacidad de pensamiento del cerebro y la velocidad de reacción ante cada situación. Para ser justos, el equipo de DeepMind obstaculizó intencionalmente AlphaStar, retrasando el tiempo de cálculo, la latencia y limitando la cantidad de acciones que podía realizar por minuto. Sin embargo, AlphaStar todavía sabe cómo superarlo todo y tener un rendimiento excelente.
"La jugabilidad de AlphaStar me pareció extremadamente impresionante", dijo en un comunicado Dario "TLO" Wünsch, un experto alemán en StarCraft II. "El sistema es muy hábil a la hora de evaluar su posición estratégica y sabe exactamente cuándo atacar o soltar al oponente".
El hecho de que las máquinas puedan derrotar completamente a los humanos en un videojuego complejo puede parecer aterrador como un escenario apocalíptico en el que los robots invaden la tierra, pero en realidad, el equipo de DeepMind desarrolla modelos de inteligencia artificial como AlphaStar para mejorar otros sistemas del mundo real.
Para los investigadores, dominar un complejo juego de estrategia en tiempo real como StarCraft II es uno de los primeros pasos hacia la creación de una IA mejor y más segura para aplicaciones que podrían cambiar a la humanidad, como la atención médica, los vehículos autónomos y la robótica.