Computerwetenschappelijke onderzoekers van Nvidia, de Universiteit van Toronto en het Vector Institute of Artificial Intelligence in Toronto hebben een manier bedacht om nauwkeuriger te detecteren en te voorspellen waar een object begint en eindigt. Dit soort kennis kan de gevolgtrekkingen voor de huidige computer vision-modellen helpen verbeteren, terwijl ook het labelen van trainingsgegevens voor toekomstige modellen wordt ondersteund.
In een reeks experimenten van het onderzoeksteam ontdekten wetenschappers dat het kunstmatige-intelligentiemodel Semantisch Thinned Edge Alignment Learning (STEAL) kan helpen de nauwkeurigheid van het ‘semantische grens’-voorspellingsmodel te verbeteren.’ Het moderne CASENet steeg met 4%. Het vermogen om de grenzen en randen van een object nauwkeuriger te identificeren zou praktische toepassingen kunnen hebben voor computer vision-taken, van het genereren van beelden tot 3D-ruimtereconstructie om objecten te detecteren.
Semantisch uitgedunde Edge Alignment Learning (STEAL)
STEAL kan worden toegepast om bestaande CNN's of objectranddetectiemodellen te verbeteren, maar onderzoekers geloven ook dat het hen ook kan helpen gegevens effectiever te labelen of te annoteren. Om dit punt te bewijzen, gebruikten wetenschappers de STEAL-methode om Cityscapes te verfijnen - een dataset met inhoud gerelateerd aan de stedelijke omgeving - die voor het eerst werd geïntroduceerd op de Machine Vision-conferentie Computer Vision and Pattern Recognition (CVPR) in 2016.
Momenteel op GitHub kan het STEAL-framework elke hoek van een object in pixels relatief nauwkeurig leren en voorspellen met behulp van een methode die onderzoekers 'actieve uitlijning' noemen. Expliciete redeneringen over annotatieruis tijdens training en niveaubepalende formules voor neurale netwerken bij het leren van vertekende labelrepresentaties op een end-to-end manier helpen ook resultaten te behalen.
Mogelijkheid om grenzen en randen van een object nauwkeuriger te identificeren
"We laten verder zien dat onze voorspellingsgrenzen beter presteren dan die verkregen uit de nieuwste DeepLab-v3-segmentoutputs, terwijl we alleen de architectuur gebruiken die veel lichter is", zei een vertegenwoordiger van het onderzoeksteam in een diepgaand interview met de arXiv-nieuwssite.
Dit onderzoekswerk is getiteld: "Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations", en zal breed worden geïntroduceerd via een presentatie in het kader van de CVPR 2019-conferentie die plaatsvindt in Long Beach, Californië. Experts van Nvidia Research hebben een belangrijke bijdrage geleverd aan dit onderzoek en zij zullen het onderzoek dit jaar ook specifiek vanuit een persoonlijk perspectief presenteren tijdens de CVPR.
![Nvidia's STEAL AI levert betere ondersteuning voor gevolgtrekkingen voor computer vision-modellen Nvidia's STEAL AI levert betere ondersteuning voor gevolgtrekkingen voor computer vision-modellen]()
Volgens nieuw gerapporteerd nieuws zei Nvidia dat het in 2020 krachtige computerhardwaresystemen van de Britse fabrikant Arm en open source TensorRT-parsing-inferentiesoftware op Github zal ondersteunen om meer maatwerk mogelijk te maken.