DeepMind Technologies, la filiale IA d'Alphabet - spécialisée dans la recherche en IA depuis de nombreuses années, a lancé une nouvelle plateforme d'intelligence artificielle appelée AlphaZero. Cette IA exploite des réseaux neuronaux profonds pour apprendre rapidement à jouer au Go, aux échecs et au Shogi sans aucune intervention humaine.
AlphaZero a été opposé aux meilleures IA du monde dans les jeux de société ci-dessus, notamment :
- Stockfish : champion du monde d'IA aux échecs.
- Elmo : Champion du 27e Championnat du monde de shogi informatique en 2017.
- AlphaGo Zero : AI est considéré comme le joueur de Go le plus puissant de l'histoire, créé par Deep Mind lui-même.
Dans les trois compétitions, AlphaZero n’a reçu qu’une connaissance de base des règles du jeu. Puis il a appris tout seul en jouant lui-même des millions de matches. Initialement, AlphaZero a simplement essayé de nombreuses stratégies aléatoires pour gagner, puis, grâce à un processus d'essais et d'erreurs appelé « apprentissage par renforcement », il a progressivement appris quelles stratégies étaient les plus efficaces.
Pour l'apprentissage et la formation, AlphaZero utilise 5 000 unités de traitement tensoriel (TPU - une seule unité peut traiter plus de 100 millions de photos sur Google Photos chaque jour) pendant 9 heures avec les échecs, 12 heures avec le Shogi et 13 jours avec le Go.
Après avoir terminé le processus d'apprentissage, AlphaZero est autorisé à affronter d'autres adversaires. Et bien sûr, AlphaZero a rapidement éliminé ses adversaires pour devenir le concurrent le plus puissant de l’histoire.

L'équipe DeepMind a équipé AlphaZero d'un système qui combine des algorithmes d'apprentissage et la « recherche arborescente de Monte Carlo » (MCTS), une méthode qui aide les IA qui jouent au Go à déterminer quel mouvement effectuer ensuite pour l'aider à apprendre à jouer aux échecs et au Shogi. Les résultats montrent que MCTS peut être adapté à d’autres jeux complexes.
Ce qui est intéressant, c’est qu’AlphaZero n’a pas besoin de conseils humains, il recherche lui-même des stratégies et propose des idées que les gens n’ont jamais vues auparavant. AlphaZero a un style de jeu agressif et un haut degré de flexibilité qui a même surpris le grand joueur d'échecs Matthew Sadler.
Grâce à ses stratégies et capacités uniques, AlphaZero devient un excellent outil d'enseignement des échecs, encourageant la création d'un gameplay tactique sans précédent pour ceux qui souhaitent apprendre les échecs.
En savoir plus :