Het ontwerpen van AI-systemen die in staat zijn om op individueel niveau nauwkeurig de kenmerken van elke plaats in de wereld te herkennen (d.w.z. duidelijk onderscheid kunnen maken tussen plaatsen in dezelfde categorie, bijvoorbeeld de Niagarawatervallen met een andere waterval) en het ophalen van afbeeldingen (objecten in afbeeldingen met andere versies van dat object in elke categorie) behoren tot de al lang bestaande doelstellingen van de afdeling intellectueel onderzoek. De kunstmatige intelligentie van Google is van bijzonder belang. Vorig jaar bracht het bedrijf Google-Landmarks uit, een datapakket met betrekking tot oriëntatiepunten op aarde waarvan Google beweerde dat het destijds de grootste ter wereld was, en organiseerde het ook twee wedstrijden (Landmark Recognition 2018 en Landmark Retriny 2018), waar meer dan 500 toonaangevende onderzoekers op het gebied van machine learning en kunstmatige intelligentie ter wereld.

Na het succes van vorig jaar heeft Google gisteren op 5 mei officieel het Google-Landmarks-v2 AI-trainingsdatawarehouse met open source-code uitgebracht, als een belangrijke stap in het plan om met succes nieuwe technologieën te ontwikkelen. Computer vision-modellen kunnen oriëntatiepunten over de hele wereld herkennen meer snel, nauwkeurig en verfijnd. Dit datawarehouse van Google-Landmarks-v2 is veel groter van omvang dan de vorige versie en bevat tot 5 miljoen foto's (twee keer zoveel als de vorige versie) van 200.000 oriëntatiepunten (zeven keer zoveel als de vorige versie) over de hele wereld. Rond de wereld.
Bovendien is Google niet vergeten dit jaar twee nieuwe ‘uitdagingen’ te lanceren, Landmark Recognition 2019 en Landmark Retriny 2019, op de Kaggle machine learning-gemeenschap, en heeft tegelijkertijd de broncode en het model voor Detect-to-Retrieve vrijgegeven, een raamwerk helpt afbeeldingen effectiever per regio te herstellen.
![Google brengt een enorm AI-trainingsdatawarehouse uit met meer dan 5 miljoen foto's van 200.000 oriëntatiepunten wereldwijd Google brengt een enorm AI-trainingsdatawarehouse uit met meer dan 5 miljoen foto's van 200.000 oriëntatiepunten wereldwijd]()
“Zowel beeldherkennings- als ophaalmethoden zullen over het algemeen grotere trainingsdatasets vereisen in termen van zowel het aantal afbeeldingen als de diversiteit van oriëntatiepunten om het systeem beter te trainen en ook sterker te maken. We hopen dat deze dataset zal helpen de beeldherkennings- en ophaalmogelijkheden van moderne AI-modellen grondiger te verbeteren”, aldus twee software-ingenieurs van het Google AI-team, Bingyi Cao en Tobias. Weyand deelden.
Bovendien zijn er volgens deze twee experts 5 miljoen foto's van meer dan 200.000 oriëntatiepunten opgeslagen in Google-Landmarks-v2 verzameld en bijgedragen door fotografen over de hele wereld. Elke foto wordt gelabeld met een specifieke beschrijving van de locatie en de auteur, bijvoorbeeld kasteel Neuschwanstein, Golden Gate Bridge, Kiyomizu-dera, Burj Khalifa, Giza Sphinx (Grote Sfinx van Gizeh), Machu Picchu en vele andere beroemde bezienswaardigheden. Google-onderzoekers voegden vervolgens historische, weinig bekende foto's toe die waren verzameld van Wikimedia Commons, het online archief van de Wikimedia Foundation met afbeeldingen, geluiden en meer.
![Google brengt een enorm AI-trainingsdatawarehouse uit met meer dan 5 miljoen foto's van 200.000 oriëntatiepunten wereldwijd Google brengt een enorm AI-trainingsdatawarehouse uit met meer dan 5 miljoen foto's van 200.000 oriëntatiepunten wereldwijd]()
Dus wat is het grootste probleem dat het Detect-to-Retrieve-framework oplost? Zoals uitgelegd door Bingyi Cao en Tobias Weyand, kunnen de door Google uitgebrachte modellen (getraind op een subset van 80.000 afbeeldingen uit de eerste Google-Landmarks-dataset) profiteren van begrenzende kaders. met interessante items, waardoor de nauwkeurigheid aanzienlijk wordt verbeterd.
Daarnaast zijn Landmark Recognition 2019 (waar deelnemende teams de taak hebben om AI-modellen te ontwerpen om oriëntatiepunten te helpen identificeren) en Landmark Retriny 2019 (deelnemende teams gebruiken AI-systemen om afbeeldingen te vinden om een aangewezen plaats nauwkeurig weer te geven) vanaf vandaag begonnen met het accepteren van registraties voor deelname. Aan beide competities zijn geldprijzen verbonden van in totaal $ 50.000, en de winnende teams zullen door Google worden uitgenodigd om later dit jaar de Conference on Computer Vision and Pattern Recognition (Conference on Computer Vision and Pattern Recognition) bij te wonen, die later dit jaar in Long Beach, Californië wordt gehouden, om te presenteren de details van de aanpak die zij hebben geïmplementeerd.