DeepMind Technologies, de AI-dochteronderneming van Alphabet – al jaren gespecialiseerd in AI-onderzoek, heeft een nieuw platform voor kunstmatige intelligentie gelanceerd, genaamd AlphaZero. Deze AI maakt gebruik van diepe neurale netwerken om snel Go, schaken en Shogi te leren spelen zonder enige menselijke tussenkomst.
AlphaZero nam het op tegen 's werelds beste AI's in de bovenstaande bordspellen, waaronder:
- Stockfish: AI-wereldkampioen schaken.
- Elmo: kampioen van het 27e Wereldkampioenschap Computer Shogi in 2017.
- AlphaGo Zero: AI zou de sterkste Go-speler in de geschiedenis zijn, gemaakt door Deep Mind zelf.
In alle drie de competities werd AlphaZero alleen voorzien van basiskennis van de spelregels. Vervolgens leerde het zichzelf door miljoenen wedstrijden voor zichzelf te spelen. Aanvankelijk probeerde AlphaZero gewoon veel willekeurige strategieën om te winnen, maar door een proces van vallen en opstaan genaamd 'reinforcement learning' leerde het geleidelijk welke strategieën het meest effectief waren.
Bij het leren en trainen gebruikt AlphaZero 5.000 tensorverwerkingseenheden (TPU - een enkele eenheid kan elke dag meer dan 100 miljoen foto's op Google Foto's verwerken) gedurende 9 uur met schaken, 12 uur voor Shogi en 13 dagen voor Go.
Na voltooiing van het leerproces mag AlphaZero het opnemen tegen andere tegenstanders. En natuurlijk schakelde AlphaZero zijn tegenstanders snel uit om de sterkste concurrent in de geschiedenis te worden.

Het DeepMind-team heeft AlphaZero uitgerust met een systeem dat leeralgoritmen combineert met "Monte Carlo tree search" (MCTS), een methode die Go-playing AI's helpt bepalen welke zet ze vervolgens moeten maken, om hem te helpen schaken en Shogi te leren spelen. De resultaten laten zien dat MCTS kan worden aangepast aan andere complexe games.
Het interessante is dat AlphaZero geen menselijke begeleiding nodig heeft, het onderzoekt zelf strategieën en komt met ideeën die mensen nog nooit eerder hebben gezien. AlphaZero heeft een agressieve speelstijl en een hoge mate van flexibiliteit die zelfs de grote schaker Matthew Sadler verraste.
Met zijn unieke strategieën en mogelijkheden wordt AlphaZero een uitstekend schaakleermiddel, dat de creatie van ongekende tactische gameplay aanmoedigt voor degenen die willen leren schaken.
Bekijk meer: