DeepMind, een Google-bedrijf met hoofdkantoor in Groot-Brittannië, heeft onlangs Generative Query Network (GQN) ontwikkeld: een neuraal netwerk dat is ontworpen om kunstmatige intelligentie (AI) te leren hoe ze zich kunnen voorstellen hoe objecten eruit zullen zien. Hoe zit het vanaf de andere kant?
Concreet zal AI 2D-beelden analyseren en vervolgens een 3D-panorama kunnen weergeven. Wat het vermelden waard is, is dat de kunstmatige intelligentie van DeepMind slechts naar minimaal 3 afbeeldingen kijkt zonder gebruik te maken van invoergegevens of kennis, en onmiddellijk de 3D-versie van dat beeld kan voorspellen.

AI-onderzoekers proberen machines te leren hoe ze kunnen waarnemen als mensen, door aannames te doen na het observeren van hun omgeving, waarbij ze specifiek de vorm van meubels en scènes vanuit verschillende hoeken raden dat deze nog niet "bewonderd" is.
![De AI van Google kan 3D-afbeeldingen maken van ‘platte’ 2D-foto’s De AI van Google kan 3D-afbeeldingen maken van ‘platte’ 2D-foto’s]()
U maakt bijvoorbeeld een foto van een Rubiks kubus en vraagt Ai om de foto vanuit een andere hoek opnieuw te maken. Kunstmatige intelligentie - met behulp van GQN moet je visualiseren hoe de kubus (belichting, schaduw, rechte lijnen) er aan de overige zijden uit zal zien om het beeld te kunnen weergeven dat je nodig hebt.
![De AI van Google kan 3D-afbeeldingen maken van ‘platte’ 2D-foto’s De AI van Google kan 3D-afbeeldingen maken van ‘platte’ 2D-foto’s]()
Momenteel is het kunstmatige intelligentiesysteem van DeepMind niet getraind met beelden van de echte wereld. Vervolgens laten de onderzoekers het levensechte landschappen van foto's weergeven.
Het systeem van Deepmind dat GQN gebruikt, zal naar verwachting in de toekomst alleen 2D-beelden kunnen gebruiken om uiterst nauwkeurige 3D-scènes te creëren.
Bekijk meer: