Informatycy z Nvidii, Uniwersytetu w Toronto i Instytutu Sztucznej Inteligencji Vector w Toronto opracowali sposób na dokładniejsze wykrywanie i przewidywanie, gdzie zaczyna się i kończy obiekt. Tego rodzaju wiedza może pomóc w ulepszeniu wnioskowania dla bieżących modeli wizji komputerowej, jednocześnie wspierając etykietowanie danych szkoleniowych dla przyszłych modeli.
W serii eksperymentów przeprowadzonych przez zespół badawczy naukowcy odkryli, że model sztucznej inteligencji Semantycznie cienkie uczenie się wyrównywania krawędzi (STEAL) może pomóc poprawić dokładność modelu predykcji „granicy semantycznej”. Współczesna sieć CASENet wzrosła o 4%. Zdolność do dokładniejszej identyfikacji granic i krawędzi obiektu może mieć praktyczne zastosowanie w zadaniach związanych z wizją komputerową, od generowania obrazu po rekonstrukcję przestrzeni 3D, aż po wykrywanie obiektów.
Semantycznie cienkie uczenie się wyrównania krawędzi (KRADŹ)
STEAL można zastosować do ulepszenia istniejących CNN lub modeli wykrywania krawędzi obiektów, ale badacze uważają, że może również pomóc im w skuteczniejszym oznaczaniu i opisywania danych w modelach widzenia komputerowego. Aby to udowodnić, naukowcy wykorzystali metodę STEAL do udoskonalenia Cityscapes – zbioru danych zawierającego treści związane ze środowiskiem miejskim – zaprezentowanego po raz pierwszy na konferencji Machine Vision Computer Vision and Pattern Recognition (CVPR) w 2016 roku.
Obecnie dostępna na GitHubie platforma STEAL może stosunkowo dokładnie uczyć się i przewidywać każdy narożnik obiektu w pikselach, korzystając z metody zwanej przez badaczy „aktywnym wyrównaniem”. Wyraźne rozumowanie dotyczące szumu adnotacji podczas uczenia oraz formuły ustalania poziomów dla sieci neuronowych podczas uczenia się na podstawie stronniczych reprezentacji etykiet w sposób kompleksowy również pomagają w uzyskaniu wyników. To.
Możliwość dokładniejszego identyfikowania granic i krawędzi obiektu
„Pokazujemy ponadto, że nasze granice przewidywań przewyższają te uzyskane z wyników najnowszego segmentu DeepLab-v3, korzystając wyłącznie z architektury. Architektura jest znacznie lżejsza” – powiedział przedstawiciel zespołu badawczego w szczegółowym wywiadzie dla serwisu informacyjnego arXiv.
Ta praca badawcza nosi tytuł: „Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations” i zostanie szeroko zaprezentowana poprzez prezentację w ramach konferencji CVPR 2019 odbywającej się w Long Beach w Kalifornii. Eksperci z Nvidia Research wnieśli znaczący wkład w te badania, a podczas tegorocznego CVPR zaprezentują je również z osobistej perspektywy.
Według nowo opublikowanych wiadomości, Nvidia poinformowała, że w 2020 r. będzie obsługiwać wysokowydajne systemy sprzętu komputerowego brytyjskiego producenta Arm oraz oprogramowanie do wnioskowania analizującego TensorRT typu open source na platformie Github , aby umożliwić większą personalizację.