Google veröffentlicht ein riesiges KI-Trainingsdatenlager mit mehr als 5 Millionen Fotos von 200.000 Sehenswürdigkeiten weltweit

Google veröffentlicht ein riesiges KI-Trainingsdatenlager mit mehr als 5 Millionen Fotos von 200.000 Sehenswürdigkeiten weltweit

Entwicklung von KI-Systemen, die in der Lage sind, die Merkmale jedes Ortes auf der Welt auf individueller Ebene genau zu erkennen (d. h. klar zwischen Orten in derselben Kategorie unterscheiden zu können, z. B. Niagarafälle und andere Wasserfälle) und Bilder abzurufen (Objekte in Bildern). mit anderen Versionen dieses Objekts in jeder Kategorie) gehören zu den langjährigen Zielen der Abteilung für intellektuelle Forschung. Von besonderem Interesse ist die künstliche Intelligenz von Google. Letztes Jahr veröffentlichte das Unternehmen Google-Landmarks, ein Datenpaket zu den Wahrzeichen der Erde, von dem Google behauptete, es sei das damals größte der Welt, und es organisierte außerdem zwei Wettbewerbe (Landmark Recognition 2018 und Landmark Retriny 2018), an denen mehr als 100.000 Menschen teilnahmen 500 führende Forscher für maschinelles Lernen und künstliche Intelligenz weltweit.

Google veröffentlicht ein riesiges KI-Trainingsdatenlager mit mehr als 5 Millionen Fotos von 200.000 Sehenswürdigkeiten weltweit

Nach dem Erfolg des letzten Jahres veröffentlichte Google gestern, am 5. Mai, offiziell das Google-Landmarks-v2 AI Training Data Warehouse mit Open-Source-Code, als wichtiger Schritt im Plan zur erfolgreichen Entwicklung neuer Technologien. Computer-Vision-Modelle können Wahrzeichen auf der ganzen Welt besser erkennen schnell, präzise und anspruchsvoll. Dieses Google-Landmarks-v2-Data-Warehouse ist viel größer als die Vorgängerversion und verfügt über bis zu 5 Millionen Fotos (doppelt so viele wie die Vorgängerversion) von 200.000 Sehenswürdigkeiten (siebenmal so viele wie die Vorgängerversion) auf der ganzen Welt. Auf der ganzen Welt.

Darüber hinaus hat Google nicht vergessen, in diesem Jahr zwei neue „Herausforderungen“ in der Kaggle-Community für maschinelles Lernen, Landmark Recognition 2019 und Landmark Retriny 2019, zu starten und gleichzeitig den Quellcode und das Modell für Detect-to-Retrieve zu veröffentlichen. Ein Framework hilft dabei, Bilder nach Regionen effektiver wiederherzustellen.

Google veröffentlicht ein riesiges KI-Trainingsdatenlager mit mehr als 5 Millionen Fotos von 200.000 Sehenswürdigkeiten weltweit

„Sowohl Bilderkennungs- als auch Abrufmethoden erfordern im Allgemeinen größere Trainingsdatensätze, sowohl hinsichtlich der Anzahl der Bilder als auch der Vielfalt der Orientierungspunkte, um das System besser und stärker zu trainieren.“ „Wir hoffen, dass dieser Datensatz dazu beitragen wird, die Bilderkennungs- und Abruffunktionen moderner KI-Modelle gründlicher zu verbessern“, sagten zwei Software-Ingenieure im Google AI-Team, Bingyi Cao und Tobias. Weyand teilte mit.

Darüber hinaus werden nach Angaben dieser beiden Experten 5 Millionen Fotos von mehr als 200.000 in Google-Landmarks-v2 gespeicherten Sehenswürdigkeiten gesammelt und von Fotografen auf der ganzen Welt bereitgestellt. Jedes Foto wird mit einer spezifischen Beschreibung des Ortes und des Autors versehen, zum Beispiel Schloss Neuschwanstein, Golden Gate Bridge, Kiyomizu-dera, Burj Khalifa, Gizeh-Sphinx (Große Sphinx von Gizeh), Machu Picchu und viele andere berühmte Sehenswürdigkeiten. Google-Forscher fügten dann historische, wenig bekannte Fotos hinzu, die aus Wikimedia Commons, dem Online-Archiv der Wikimedia Foundation mit Bildern, Tönen und anderen Arten von Mediendaten, gesammelt wurden.

Google veröffentlicht ein riesiges KI-Trainingsdatenlager mit mehr als 5 Millionen Fotos von 200.000 Sehenswürdigkeiten weltweit

Was ist also das Hauptproblem, das das Detect-to-Retrieve-Framework löst? Wie von Bingyi Cao und Tobias Weyand erklärt, können die von Google veröffentlichten Modelle (die anhand einer Teilmenge von 80.000 Bildern aus dem ersten Google-Landmarks-Datensatz trainiert wurden) die Vorteile von Begrenzungsrahmen nutzen. Begrenzungsrahmen aus einem Objekterkennungsmodell, um Bildregionen „Gewicht zu verleihen“. enthalten interessante Elemente, wodurch die Genauigkeit erheblich verbessert wird.

Darüber hinaus nehmen ab heute Anmeldungen zur Teilnahme für Landmark Recognition 2019 (bei dem die teilnehmenden Teams mit der Entwicklung von KI-Modellen zur Unterstützung der Identifizierung von Orientierungspunkten beauftragt werden) und Landmark Retriny 2019 (teilnehmende Teams verwenden KI-Systeme, um Bilder zu finden, um einen bestimmten Ort genau darzustellen) entgegen. Bei beiden Wettbewerben gibt es Geldpreise im Gesamtwert von 50.000 US-Dollar. Die Gewinnerteams werden von Google eingeladen, an der Conference on Computer Vision and Pattern Recognition (Konferenz über Computer Vision und Mustererkennung) teilzunehmen, die später in diesem Jahr in Long Beach, Kalifornien, stattfindet, um sich dort zu präsentieren die Einzelheiten des von ihnen umgesetzten Ansatzes.


Die ChatGPT-Task Force wird von Europa eingerichtet

Die ChatGPT-Task Force wird von Europa eingerichtet

Das Gremium, das die nationalen Datenschutzbeauftragten Europas vereint, gab am Donnerstag bekannt, dass es eine Task Force für ChatGPT eingerichtet habe

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

Dänische und amerikanische Wissenschaftler haben gemeinsam ein KI-System namens life2vec entwickelt, das den Zeitpunkt des menschlichen Todes mit hoher Genauigkeit vorhersagen kann.

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

Ein KI-Algorithmus namens Audioflow kann auf das Geräusch des Urinierens hören, um abnormale Urinflüsse und entsprechende Gesundheitsprobleme des Patienten effektiv und erfolgreich zu identifizieren.

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Japans alternde und schrumpfende Bevölkerung hat dazu geführt, dass dem Land eine erhebliche Zahl junger Arbeitskräfte fehlt, insbesondere im Dienstleistungssektor.

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Ein Reddit-Benutzer namens u/LegalBeagle1966 ist einer von vielen Benutzern, die in Claudia verliebt sind, ein Mädchen wie ein Filmstar, das auf dieser Plattform oft verführerische Selfies, sogar nackte, teilt.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

Microsoft hat gerade angekündigt, dass zwölf weitere Technologieunternehmen an seinem AI for Good-Programm teilnehmen werden.

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Benutzer @mortecouille92 hat die Leistungsfähigkeit des Grafikdesign-Tools Midjourney genutzt und einzigartig realistische Versionen berühmter Dragon Ball-Charaktere wie Goku, Vegeta, Bulma und Elder Kame erstellt. .

7 Techniken zur Verbesserung von ChatGPT-Antworten

7 Techniken zur Verbesserung von ChatGPT-Antworten

Durch einfaches Hinzufügen einiger Bedingungen oder Einrichten einiger Szenarien kann ChatGPT relevantere Antworten auf Ihre Fragen geben. Schauen wir uns einige Möglichkeiten an, wie Sie die Qualität Ihrer ChatGPT-Antworten verbessern können.

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Midjourney ist ein künstliches Intelligenzsystem, das aufgrund seiner äußerst schönen Gemälde, die denen echter Künstler in nichts nachstehen, in letzter Zeit in der Online-Community und der Künstlerwelt für „Fieber“ gesorgt hat.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Tage nachdem China den Ausbruch bekannt gegeben hatte, konnte das KI-System von BlueDot mit Zugriff auf weltweite Flugscheinverkaufsdaten die Ausbreitung des Wuhan-Corona-Virus nach Bangkok, Seoul, Taipeh und Tokio weiterhin genau vorhersagen.