De nieuwe AI van DeepMind kan complexe games beheersen zonder voorafgaande gameplay-training

De nieuwe AI van DeepMind kan complexe games beheersen zonder voorafgaande gameplay-training

De kunstmatige-intelligentieplatforms van DeepMind zijn de afgelopen jaren over de hele wereld beroemd geworden dankzij hun uitstekende beheersing van complexe, ‘hersenintensieve’ spellen zoals schaken, shogi en Go. In de loop van de tijd zijn ze geleidelijk ‘geëvolueerd’, waarbij ze onze gamers van vlees en bloed hebben verslagen met geavanceerde machine learning-technieken.

In 2016 introduceerde DeepMind AlphaGo, een AI-systeem met uitstekende spelmogelijkheden. Een jaar later ging het bedrijf verder met de lancering van AlphaGo Zero. Dit is de perfecte opvolger van AlphaGo, die de mogelijkheid bezit om Go te leren spelen door simpelweg menselijke wedstrijden te observeren, en vervolgens het spel onder de knie te krijgen door tegen jezelf te spelen. Dan is er AlphaZero, een nog superieur AI-systeem met de mogelijkheid om Go, schaken en shogi tegelijkertijd te spelen met slechts één enkel algoritme.

Het gemeenschappelijke punt van de bovenstaande AI-algoritmen is echter dat ze allemaal een diepgaande training op het gebied van gameplay en spelregels moeten ondergaan om een ​​bepaald spel onder de knie te kunnen krijgen. Dit is een ingewikkeld en relatief tijdrovend proces.

Om het probleem op te lossen heeft DeepMind zojuist een uiterst superieur nieuw AI-systeem gelanceerd, genaamd MuZero. Deze AI kan Go-, schaak-, shogi- en een reeks Atari-spellen vloeiend spelen zonder dat u vooraf getraind hoeft te zijn in de regelsets van de bovenstaande spellen. Het leert alles vanzelf en kan deze spellen vervolgens net zo goed of zelfs beter spelen dan alle eerdere algoritmen van DeepMind.

De nieuwe AI van DeepMind kan complexe games beheersen zonder voorafgaande gameplay-training

MuZero is in staat om veel complexe spellen vloeiend te spelen

Het creëren van een algoritme dat zich zonder voorafgaande training aan elke situatie in het spel kan aanpassen, terwijl je toch kunt bedenken hoe je dat spel onder de knie kunt krijgen, is echt een grote uitdaging waar AI-onderzoekers van ontwikkelaars al heel lang naar op zoek zijn. DeepMind probeerde dit te doen met behulp van een methode genaamd “Lookahead Search”. Met deze techniek zal het AI-algoritme rekening houden met verwachte situaties en toestanden om een ​​actieplan te creëren.

Om het begrijpelijker te maken, kun je een strategisch spel als schaken bedenken. Voordat u een beslissing of zet neemt, moet u overwegen hoe uw tegenstander zal reageren en dienovereenkomstig plannen maken. Op dezelfde manier gebruikt de AI ook de Lookahead Search-methode om te proberen enkele zetten van tevoren te plannen. Selecteer en prioriteer vervolgens de zetten die de grootste kans hebben om tot de overwinning te leiden.

Het probleem met deze aanpak is dat de meeste situaties in de echte wereld (en zelfs sommige games) geen eenvoudige set regels bevatten om te bepalen hoe ze werken. De onderzoekers losten het probleem dus op door de AI te laten modelleren hoe een bepaalde game- of scenario-omgeving de uitkomst zou beïnvloeden. Gebruik vervolgens de verkregen kennis en informatie om een ​​plan te maken. De beperking van deze methode is dat het vrijwel onmogelijk is om elk aspect te modelleren.

Daarom zal MuZero, in plaats van alles te modelleren, alleen proberen belangrijke factoren in overweging te nemen om beslissingen te nemen, vergelijkbaar met mensen. Als we bijvoorbeeld uit het raam kijken en in de verte donkere wolken zien ontstaan, zullen de meesten van ons in gedachten verzonken raken over regen, onweer, of hoe we ons moeten kleden om te voorkomen dat we betrapt worden. over zaken als condensatie en luchtdruk. Het is een vorm van instinctief selectief denken. De manier waarop MuZero "denkt" is hetzelfde.

Als het gaat om het nemen van een beslissing, moet MuZero rekening houden met drie verschillende factoren. Er wordt rekening gehouden met de resultaten van het vorige besluit, de huidige situatie en uiteindelijk de beste handelwijze om het volgende besluit te nemen. Deze ogenschijnlijk eenvoudige aanpak maakt MuZero het meest effectieve algoritme dat DeepMind tot nu toe heeft gemaakt.

De nieuwe AI van DeepMind kan complexe games beheersen zonder voorafgaande gameplay-training

MuZero is een van de meest efficiënte algoritmen

Uit interne tests bleek dat MuZero op vergelijkbare wijze presteerde als AlphaZero bij schaken, Go en shogi. En het is beter dan alle eerder uitgebrachte algoritmen, inclusief Agent57, in Atari-spellen. Bovendien geldt dat hoe meer tijd MuZero geeft om een ​​actie te overwegen, hoe efficiënter het algoritme zal zijn.

De krachtige geautomatiseerde leermogelijkheden van MuZero zouden op een dag kunnen helpen bij het oplossen van complexe problemen op veel van de hedendaagse ‘hot’ terreinen, zoals robotica – waar geen plaats is voor regels.


De ChatGPT-taskforce zal door Europa worden opgericht

De ChatGPT-taskforce zal door Europa worden opgericht

Het orgaan dat de nationale privacywaakhonden van Europa verenigt, zei donderdag dat het een taskforce heeft opgericht die zich specifiek bezighoudt met ChatGPT

AI voorspelt het tijdstip van de menselijke dood met een nauwkeurigheid van 78%

AI voorspelt het tijdstip van de menselijke dood met een nauwkeurigheid van 78%

Deense en Amerikaanse wetenschappers hebben samengewerkt om een ​​AI-systeem te ontwikkelen genaamd life2vec, dat in staat is om het tijdstip van menselijke dood met hoge nauwkeurigheid te voorspellen.

AI voorspelt urinewegaandoeningen alleen al op basis van het geluid van urine

AI voorspelt urinewegaandoeningen alleen al op basis van het geluid van urine

Een AI-algoritme genaamd Audioflow kan naar het geluid van het plassen luisteren om abnormale stromingen en bijbehorende gezondheidsproblemen van de patiënt effectief en met succes te identificeren.

Barmannen opgelet: deze robot kan in slechts 1 minuut een cocktail mixen

Barmannen opgelet: deze robot kan in slechts 1 minuut een cocktail mixen

Door de vergrijzing en de afnemende bevolking van Japan heeft het land een aanzienlijk aantal jonge werknemers nodig, vooral in de dienstensector.

Honderden mensen waren gedesillusioneerd toen ze hoorden dat het meisje van wie ze hielden een product van AI was

Honderden mensen waren gedesillusioneerd toen ze hoorden dat het meisje van wie ze hielden een product van AI was

Een Reddit-gebruiker genaamd u/LegalBeagle1966 is een van de vele gebruikers die verliefd zijn op Claudia, een filmsterachtig meisje dat vaak verleidelijke selfies deelt, zelfs naakte, op dit platform.

Nog twaalf potentiële bedrijven sluiten zich aan bij de AI-alliantie van Microsoft.

Nog twaalf potentiële bedrijven sluiten zich aan bij de AI-alliantie van Microsoft.

Microsoft heeft zojuist aangekondigd dat nog twaalf technologiebedrijven zullen deelnemen aan zijn AI for Good-programma.

AI herschept Dragon Ball-personages in vlees en bloed

AI herschept Dragon Ball-personages in vlees en bloed

Gebruiker @mortecouille92 heeft de kracht van de grafische ontwerptool Midjourney aan het werk gezet en uniek realistische versies gemaakt van beroemde Dragon Ball-personages zoals Goku, Vegeta, Bulma en oudere Kame.

7 technieken om ChatGPT-reacties te verbeteren

7 technieken om ChatGPT-reacties te verbeteren

Door enkele voorwaarden toe te voegen of enkele scenario's in te stellen, kan ChatGPT relevantere antwoorden op uw vragen geven. Laten we eens kijken naar enkele manieren waarop u de kwaliteit van uw ChatGPT-reacties kunt verbeteren.

Bewonder de prachtige schilderijen getekend door kunstmatige intelligentie

Bewonder de prachtige schilderijen getekend door kunstmatige intelligentie

Midjourney is een kunstmatig intelligentiesysteem dat de laatste tijd voor ‘koorts’ zorgt in de online community en de kunstenaarswereld vanwege zijn buitengewoon mooie schilderijen die niet onderdoen voor die van echte kunstenaars.

Dit AI-model was een van de eerste ‘experts’ die nieuws ontdekte over de uitbraak van Wuhan-longontsteking.

Dit AI-model was een van de eerste ‘experts’ die nieuws ontdekte over de uitbraak van Wuhan-longontsteking.

Dagen nadat China de uitbraak had aangekondigd, bleef het AI-systeem van BlueDot, met toegang tot wereldwijde gegevens over de verkoop van vliegtickets, nauwkeurig de verspreiding van het Wuhan Corona-virus naar Bangkok, Seoul, Taipei en Tokio voorspellen.