In een recent onderzoek bij Google probeerden ingenieurs een model van kunstmatige intelligentie (AI) te gebruiken als basis om een vierpotige robot te creëren die op een uiterst natuurlijke manier kan leren bewegen zonder al te veel hulp van mensen nodig te hebben, zoals vooruitgaan. achteruit, links en rechts draaiend. Daarnaast kan hij ook leren nauwkeurig te bewegen op drie verschillende soorten terrein, waaronder een vlakke ondergrond, zachte kussens en deurmatten met gaten.
Dit klinkt misschien eenvoudig, maar in werkelijkheid is het erg moeilijk om robotcontrollers te ontwerpen die zulke uiteenlopende en complexe navigatieopdrachten aankunnen, vooral op verschillende soorten terrein, zonder hulp van AI. Het belangrijkste probleem is dat robots zichzelf kunnen leren en zich aan veel situaties kunnen aanpassen, in plaats van dat er bij elke stap altijd menselijke tussenkomst nodig is.

De AI-technologie die in dit project wordt gebruikt heet ‘deep versterkend leren’, een aanpak gebaseerd op deep learning-technologie geïnspireerd door de psychologie van leren en ‘leren door te proberen’ en ‘leren door fouten’. De kracht van diepgaand leren werd voor het eerst gedemonstreerd in 2013 toen DeepMind een AI-model uitbracht dat kon leren hoe je klassieke Atari-spellen kunt spelen zonder enige instructies.
Videogames, of in ieder geval simulatiegames, worden ook vaak gebruikt door robotica-onderzoekers om hun AI-modellen te trainen. Het creëert een geweldige theoretische omgeving, waardoor onderzoekers hun robots in een virtuele wereld kunnen trainen voordat ze de echte wereld ingaan, waardoor de robot situaties kan herkennen en onthouden die hij ervaart wanneer hij leert hoe hij een specifieke taak moet uitvoeren.
Daarnaast promoten Google-onderzoekers ook de ontwikkeling van verbeterde algoritmen waarmee hun robots sneller kunnen leren met minder pogingen.
Het feit dat een robot in twee uur zelfstandig kan leren lopen is misschien geen schokkend resultaat, maar het laat wel een duidelijk verschil in efficiëntie zien vergeleken met ingenieurs die elke handeling specifiek moeten programmeren. De manier waarop robots werken is handmatig en uiterst passief, zoals voor. De moeilijkheden waarmee het Google-team te maken kreeg, waren echter ook enorm.
“Hoewel er in simulaties veel algoritmen voor leren zonder toezicht of diepgaande versterking zijn gedemonstreerd, is het toepassen ervan op robots in praktijkexperimenten niet eenvoudig. Ten eerste vereist diepgaand versterkend leren een grote hoeveelheid invoertrainingsgegevens, en het verzamelen van robotgegevens is ook erg duur. Ten tweede vereist het trainingsproces dat er veel tijd wordt besteed aan het monitoren van de robot. Als we een mens nodig hadden om de robot te monitoren en hem elke keer dat hij struikelde handmatig te resetten – honderden of duizenden keren – zou het veel moeite en tijd kosten om de robot te trainen. Hoe langer het duurt, hoe moeilijker het zal zijn om het leren voor robots in veel verschillende omgevingen op te schalen”, zegt Jie Tan, een van de belangrijkste ingenieurs van het project.
In de toekomst zou dit onderzoek kunnen bijdragen aan het creëren van wendbaardere robots die zich sneller kunnen aanpassen aan verschillende soorten terrein. Het toepassingspotentieel is enorm, maar het project bevindt zich nog maar in de beginfase van de ontwikkeling en er zullen nog veel uitdagingen moeten worden overwonnen.