Das KI-Modell nutzt Luft- und Bodendaten, um in schwer einsehbare Gebiete zu navigieren

Das KI-Modell nutzt Luft- und Bodendaten, um in schwer einsehbare Gebiete zu navigieren

Können Modelle künstlicher Intelligenz dabei helfen, durch Bereiche (Straßen) zu navigieren, auf denen sie noch nie zuvor trainiert wurden oder für die ihnen nicht genügend Trainingsdaten zur Verfügung stehen? Das ist es, worüber sich Wissenschaftler des DeepMind-Entwicklungsteams für künstliche Intelligenz Sorgen machen. Und nach vielen Jahren der Inkubation haben Wissenschaftler endlich Erfolg in einem Forschungsprojekt mit dem Titel „Cross-View Policy Learning for Street Navigation“, das kürzlich in einem auf Arxiv.org veröffentlichten Artikel enthüllt wurde.

In dieser Forschung beschreiben DeepMind-Wissenschaftler die Entwicklung einer KI-Richtlinie, die aus einem umfangreichen Datenlager mit vielen Blickwinkeln (hauptsächlich von oben nach unten aufgenommene Bilder) trainiert wird und auf verschiedene Bereiche der Stadt abzielt, um eine optimalere Beobachtungseffizienz zu erreichen. Die Forscher glauben, dass ein solcher Ansatz zu besseren Generalisierungsergebnissen führen würde.

Das KI-Modell nutzt Luft- und Bodendaten, um in schwer einsehbare Gebiete zu navigieren

Diese Forschung ist im Wesentlichen von der Tatsache inspiriert, dass Menschen sich schnell an den Grundriss und die Grundstruktur einer neuen Stadt gewöhnen können, indem sie den Stadtplan dieser Stadt mehrmals sorgfältig untersuchen.

„Die Fähigkeit, anhand visueller Beobachtungen in unbekannten Umgebungen zu navigieren, ist eine Kernkomponente bei der Untersuchung der Fähigkeit von KI-Modellen, Navigation zu lernen. Die Fähigkeit von KI-Modellen, sich bei fehlenden Trainingsdaten auf der Straße zurechtzufinden, ist bisher relativ begrenzt, und der Rückgriff auf Simulationsmodelle ist keine Lösung, die langfristig wirksam sein kann. „Unsere Kernidee besteht darin, die Bodenansicht mit der Luftansicht zu koppeln und gemeinsame Richtlinien zu erkunden, die den Wechsel zwischen Ansichten ermöglichen können“, sagte ein Vertreter des Forschungsteams.

Genauer gesagt besteht der erste Schritt, den Forscher tun müssen, darin, Luftkarten des Gebiets zu sammeln, durch das sie navigieren möchten (kombiniert mit Straßenbeobachtungsmodi, die auf geografischen Koordinaten basieren). entsprechender Grund). Als nächstes starteten sie eine dreiteilige Teleportationsmission, die mit dem Training der Daten und der Anpassung des Quellgebiets mithilfe von Luftbeobachtungen des Gebiets begann und mit der Bewegung zum Zielgebiet mithilfe von Bodenbeobachtungen endete.

Das maschinelle Lernsystem des Forschungsteams enthält eine Reihe von drei separaten Modulen, darunter:

  • Faltungsmodul, verantwortlich für die visuelle Wahrnehmung.
  • Das Modul Long Short-Term Memory (LSTM) ist für das Abrufen ortsspezifischer Merkmale verantwortlich.
  • Das wiederkehrende neuronale Modul für Richtlinien hilft dabei, durch Aktionen Spaltungen zu schaffen.

Dieses maschinelle Lernmodell wurde in StreetAir eingesetzt – einer multiperspektivischen Straßenumgebung im Freien, die auf StreetLearn aufbaut. (StreetLearn ist die erste interaktive Sammlung von Panoramafotos, die aus Google Street View und Google Maps extrahiert wurden).

Das KI-Modell nutzt Luft- und Bodendaten, um in schwer einsehbare Gebiete zu navigieren

In StreetAir und StreetLearn werden Luftbilder mit Panoramablick auf New York City (einschließlich Downtown NYC und Midtown NYC) und Pittsburgh (Standorte des Allegheny College und der Carnegie Mellon University) so angeordnet, dass die Umgebung bei jedem Breiten-, Längen- und Breitenkoordinatengrad wieder angezeigt wird Bilder in einer Größe von 84 x 84, der gleichen Größe wie Bilder vom Boden.

Das KI-System wird nach einer Schulung damit beauftragt, zu lernen, wie man eine Panorama-Street-View-Bildkarte mit den Längen- und Breitengradkoordinaten des Ziels lokalisiert und navigiert.

Die Panoramen decken Bereiche mit einer Seitenlänge von 2 bis 5 km und einem Abstand von etwa 10 m ab, und (KI-gesteuerte) Fahrzeuge dürfen pro Runde eine von fünf Aktionen ausführen: vorwärts bewegen, um 22,5 Grad nach links oder rechts abbiegen oder um 67,5 Grad nach links oder rechts abbiegen Grad.

Bei Annäherung an den Zielort innerhalb von 100 bis 200 Metern erhalten diese Fahrzeuge „Belohnungen“, um das schnelle und genaue Erkennen und Passieren von Kreuzungen zu fördern.

Das KI-Modell nutzt Luft- und Bodendaten, um in schwer einsehbare Gebiete zu navigieren

In Experimenten erzielten Fahrzeuge, die Luftbilder nutzten, um sich an neue Umgebungen anzupassen, Belohnungswerte von 190 bei 100 Millionen Schritten und 280 bei 200 Millionen Schritten, beides deutlich höher im Vergleich zu Fahrzeugen, die nur Bodenbeobachtungsdaten nutzten (50 bei 100 Millionen Schritten und 200 bei 200). Millionen Schritte). Den Forschern zufolge zeigten die Ergebnisse, dass ihre Methode die Fähigkeit der Fahrzeuge, effektiver Wissen über mehrere Bereiche der Zielstadt zu erlangen, deutlich verbessert.


Die ChatGPT-Task Force wird von Europa eingerichtet

Die ChatGPT-Task Force wird von Europa eingerichtet

Das Gremium, das die nationalen Datenschutzbeauftragten Europas vereint, gab am Donnerstag bekannt, dass es eine Task Force für ChatGPT eingerichtet habe

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

Dänische und amerikanische Wissenschaftler haben gemeinsam ein KI-System namens life2vec entwickelt, das den Zeitpunkt des menschlichen Todes mit hoher Genauigkeit vorhersagen kann.

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

Ein KI-Algorithmus namens Audioflow kann auf das Geräusch des Urinierens hören, um abnormale Urinflüsse und entsprechende Gesundheitsprobleme des Patienten effektiv und erfolgreich zu identifizieren.

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Japans alternde und schrumpfende Bevölkerung hat dazu geführt, dass dem Land eine erhebliche Zahl junger Arbeitskräfte fehlt, insbesondere im Dienstleistungssektor.

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Ein Reddit-Benutzer namens u/LegalBeagle1966 ist einer von vielen Benutzern, die in Claudia verliebt sind, ein Mädchen wie ein Filmstar, das auf dieser Plattform oft verführerische Selfies, sogar nackte, teilt.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

Microsoft hat gerade angekündigt, dass zwölf weitere Technologieunternehmen an seinem AI for Good-Programm teilnehmen werden.

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Benutzer @mortecouille92 hat die Leistungsfähigkeit des Grafikdesign-Tools Midjourney genutzt und einzigartig realistische Versionen berühmter Dragon Ball-Charaktere wie Goku, Vegeta, Bulma und Elder Kame erstellt. .

7 Techniken zur Verbesserung von ChatGPT-Antworten

7 Techniken zur Verbesserung von ChatGPT-Antworten

Durch einfaches Hinzufügen einiger Bedingungen oder Einrichten einiger Szenarien kann ChatGPT relevantere Antworten auf Ihre Fragen geben. Schauen wir uns einige Möglichkeiten an, wie Sie die Qualität Ihrer ChatGPT-Antworten verbessern können.

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Midjourney ist ein künstliches Intelligenzsystem, das aufgrund seiner äußerst schönen Gemälde, die denen echter Künstler in nichts nachstehen, in letzter Zeit in der Online-Community und der Künstlerwelt für „Fieber“ gesorgt hat.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Tage nachdem China den Ausbruch bekannt gegeben hatte, konnte das KI-System von BlueDot mit Zugriff auf weltweite Flugscheinverkaufsdaten die Ausbreitung des Wuhan-Corona-Virus nach Bangkok, Seoul, Taipeh und Tokio weiterhin genau vorhersagen.