DeepMind, une société de Google dont le siège est au Royaume-Uni, a récemment développé Generative Query Network (GQN) – un réseau neuronal conçu pour enseigner à l'intelligence artificielle (IA) comment imaginer à quoi ressembleront les objets.
Plus précisément, l’IA analysera les images 2D et pourra ensuite restituer un panorama 3D. Ce qui mérite d'être mentionné, c'est que l'intelligence artificielle de DeepMind n'examine qu'au moins 3 images sans utiliser aucune donnée d'entrée ni connaissance, et peut immédiatement prédire la version 3D de cette image.

Les chercheurs en IA tentent d'enseigner aux machines comment percevoir comme les humains, en faisant des hypothèses après avoir observé leur environnement, en devinant spécifiquement la forme des meubles et des scènes sous différents angles, qu'elles n'ont pas encore été « admirées ».

Par exemple, vous prenez une photo d'un Rubik's cube et demandez à Ai de recréer l'image sous un angle différent. Intelligence artificielle - en utilisant GQN, vous devez visualiser à quoi ressemblera le cube (éclairage, ombrage, lignes droites) sur les côtés restants pour pouvoir restituer l'image dont vous avez besoin. .

Actuellement, le système d’intelligence artificielle de DeepMind n’a pas été entraîné avec des images du monde réel. Ensuite, les chercheurs le laisseront restituer des paysages réels à partir de photos.
Le système de Deepmind utilisant GQN devrait pouvoir utiliser uniquement des images 2D pour créer des scènes 3D extrêmement précises à l'avenir.
En savoir plus :