Le modèle dIA utilise des données aériennes et terrestres pour naviguer vers des zones difficiles à observer

Le modèle dIA utilise des données aériennes et terrestres pour naviguer vers des zones difficiles à observer

Les modèles d’intelligence artificielle peuvent-ils les aider à naviguer dans des zones (rues) sur lesquelles ils n’ont jamais été formés auparavant, ou pour lesquels ils n’ont pas reçu suffisamment de données de formation ? C’est ce qui préoccupe les scientifiques de l’équipe de développement de l’intelligence artificielle DeepMind. Et après de nombreuses années d'incubation, les scientifiques ont finalement réussi dans un projet de recherche intitulé : « Cross-View Policy Learning for Street Navigation », récemment révélé dans un article publié sur Arxiv.org.

Dans cette recherche, les scientifiques de DeepMind décrivent le développement d'une politique d'IA formée à partir d'un riche entrepôt de données sous de nombreux angles (principalement des images prises de haut en bas), ciblant différentes zones de la ville, pour une efficacité d'observation plus optimale. Les chercheurs pensent qu’une telle approche permettrait d’obtenir de meilleurs résultats de généralisation.

Le modèle d'IA utilise des données aériennes et terrestres pour naviguer vers des zones difficiles à observer

Essentiellement, cette recherche s'inspire du fait que les gens peuvent s'adapter rapidement à l'aménagement et à la structure de base d'une nouvelle ville en examinant attentivement la carte de cette ville à plusieurs reprises.

« La capacité de naviguer à partir d’observations visuelles dans des environnements inconnus est un élément essentiel de l’étude de la capacité des modèles d’IA à apprendre la navigation. La capacité des modèles d'IA à naviguer dans les rues dans les cas où il y a un manque de données de formation a été jusqu'à présent relativement limitée, et s'appuyer sur des modèles de simulation n'est pas une solution qui peut être efficace à long terme. Notre idée principale est de coupler la vue au sol avec la vue aérienne et d’explorer des politiques communes qui peuvent permettre de basculer entre les vues », a déclaré un représentant de l’équipe de recherche.

Plus précisément, la première étape que devront accomplir les chercheurs est de collecter des cartes aériennes de la zone dans laquelle ils comptent naviguer (en combinaison avec des modes d'observation des rues basés sur des coordonnées géographiques (raison correspondante). Ensuite, ils se sont lancés dans une mission de téléportation en trois parties, commençant par une formation sur les données et ajustant la zone source à l'aide d'observations aériennes de la zone, et se terminant par un déplacement vers la zone ciblée à l'aide d'observations au sol.

Le système d'apprentissage automatique de l'équipe de recherche contient un ensemble de 3 modules distincts, notamment :

  • Module convolutif, responsable de la perception visuelle.
  • Le module de mémoire à long terme (LSTM) est chargé de récupérer les caractéristiques spécifiques à l'emplacement.
  • Le module neuronal récurrent de politique aide à créer des divisions par le biais d’actions.

Ce modèle d'apprentissage automatique a été déployé dans StreetAir - un environnement de rue extérieur à perspectives multiples - construit sur StreetLearn. (StreetLearn est la première collection interactive de photos panoramiques extraites de Google Street View et Google Maps).

Le modèle d'IA utilise des données aériennes et terrestres pour naviguer vers des zones difficiles à observer

Dans StreetAir et StreetLearn, des images aériennes contenant des vues panoramiques de la ville de New York (y compris Downtown NYC et Midtown NYC) et de Pittsburgh (campus de l'Allegheny College et de l'Université Carnegie Mellon) sont disposées de manière à ce qu'à chaque degré de coordonnée de latitude et de longitude, l'environnement redevienne aérien. images à une taille de 84 x 84, la même taille que les images du sol.

Le système d'IA, après avoir suivi une formation, sera chargé d'apprendre à localiser et à naviguer sur une carte d'image panoramique Street View avec les coordonnées de longitude et de latitude de la destination.

Les panoramas couvrent des zones de 2 à 5 km de côté, espacées d'environ 10 m, et les véhicules (contrôlés par l'IA) seront autorisés à effectuer 1 des 5 actions par tour : avancer, tourner à gauche ou à droite de 22,5 degrés ou tourner à gauche ou à droite de 67,5 degrés. degrés.

À l'approche de l'emplacement cible dans un rayon de 100 à 200 mètres, ces véhicules recevront des « récompenses » pour encourager l'identification et le passage rapide et précis des intersections.

Le modèle d'IA utilise des données aériennes et terrestres pour naviguer vers des zones difficiles à observer

Lors d'expériences, les véhicules qui exploitaient des images aériennes pour s'adapter à de nouveaux environnements ont obtenu des récompenses de 190 à 100 millions de pas et de 280 à 200 millions de pas, tous deux nettement plus élevés que les véhicules utilisant uniquement des données d'observation au sol (50 à 100 millions de pas et 200 à 200 millions de pas). millions de pas). Selon les chercheurs, les résultats ont montré que leur méthode améliore considérablement la capacité des véhicules à acquérir plus efficacement des connaissances sur plusieurs zones de la ville cible.


Le groupe de travail ChatGPT sera créé par l’Europe

Le groupe de travail ChatGPT sera créé par l’Europe

L'organisme qui rassemble les organismes nationaux de surveillance de la vie privée en Europe a annoncé jeudi avoir créé un groupe de travail dédié à ChatGPT.

LIA prédit lheure de la mort humaine avec une précision de 78 %

LIA prédit lheure de la mort humaine avec une précision de 78 %

Des scientifiques danois et américains ont collaboré pour développer un système d'IA appelé life2vec, capable de prédire l'heure de la mort humaine avec une grande précision.

L’IA prédit les maladies urinaires rien qu’au son de l’urine

L’IA prédit les maladies urinaires rien qu’au son de l’urine

Un algorithme d’IA appelé Audioflow peut écouter le bruit de la miction pour identifier efficacement et avec succès les flux anormaux et les problèmes de santé correspondants du patient.

Barmans, attention : ce robot peut préparer un cocktail en 1 minute seulement

Barmans, attention : ce robot peut préparer un cocktail en 1 minute seulement

En raison du vieillissement et du déclin de la population japonaise, le pays manque d'un nombre important de jeunes travailleurs, notamment dans le secteur des services.

Des centaines de personnes ont été déçues lorsqu’elles ont appris que la fille qu’ils aimaient était un produit de l’IA

Des centaines de personnes ont été déçues lorsqu’elles ont appris que la fille qu’ils aimaient était un produit de l’IA

Un utilisateur de Reddit nommé u/LegalBeagle1966 est l'un des nombreux utilisateurs amoureux de Claudia, une fille ressemblant à une star de cinéma qui partage souvent des selfies séduisants, même nus, sur cette plateforme.

12 autres entreprises potentielles rejoignent « lalliance IA » de Microsoft.

12 autres entreprises potentielles rejoignent « lalliance IA » de Microsoft.

Microsoft vient d'annoncer que 12 autres entreprises technologiques participeront à son programme AI for Good.

LIA recrée les personnages de Dragon Ball en chair et en os

LIA recrée les personnages de Dragon Ball en chair et en os

L'utilisateur @mortecouille92 a mis à profit la puissance de l'outil de conception graphique Midjourney et a créé des versions réalistes uniques de personnages célèbres de Dragon Ball comme Goku, Vegeta, Bulma et l'aîné Kame. .

7 techniques pour améliorer les réponses ChatGPT

7 techniques pour améliorer les réponses ChatGPT

En ajoutant simplement quelques conditions ou en mettant en place des scénarios, ChatGPT peut donner des réponses plus pertinentes à vos requêtes. Examinons quelques façons d'améliorer la qualité de vos réponses ChatGPT.

Émerveillez-vous devant les magnifiques peintures dessinées par lintelligence artificielle

Émerveillez-vous devant les magnifiques peintures dessinées par lintelligence artificielle

Midjourney est un système d'intelligence artificielle qui a récemment provoqué une "fièvre" dans la communauté en ligne et dans le monde des artistes en raison de ses peintures extrêmement belles qui ne sont pas inférieures à celles de vrais artistes.

Ce modèle dIA a été lun des premiers « experts » à découvrir des nouvelles sur lépidémie de pneumonie de Wuhan.

Ce modèle dIA a été lun des premiers « experts » à découvrir des nouvelles sur lépidémie de pneumonie de Wuhan.

Quelques jours après que la Chine a annoncé l'épidémie, grâce à l'accès aux données mondiales sur les ventes de billets d'avion, le système d'IA de BlueDot a continué à prédire avec précision la propagation du virus Corona de Wuhan à Bangkok, Séoul, Taipei et Tokyo.