Des chercheurs en informatique de Nvidia, de l'Université de Toronto et du Vector Institute of Artificial Intelligence de Toronto ont mis au point un moyen de détecter et de prédire plus précisément où commence et se termine un objet. Ce type de connaissances peut contribuer à améliorer l’inférence pour les modèles de vision par ordinateur actuels, tout en prenant également en charge l’étiquetage des données de formation pour les modèles futurs.
Dans une série d'expériences menées par l'équipe de recherche, les scientifiques ont découvert que le modèle d'intelligence artificielle Semantical Thinned Edge Alignment Learning (STEAL) peut aider à améliorer la précision du modèle de prédiction de la « limite sémantique ». Le CASENet moderne a augmenté de 4 %. La capacité d'identifier plus précisément les limites et les bords d'un objet pourrait avoir des applications pratiques pour les tâches de vision par ordinateur, de la génération d'images à la reconstruction de l'espace 3D, pour détecter des objets.
Apprentissage d'alignement de bord sémantiquement affiné (STEAL)
STEAL peut être appliqué pour améliorer les CNN ou les modèles de détection de contours d'objets existants, mais les chercheurs pensent également que cela peut également les aider à étiqueter ou à annoter plus efficacement les modèles de vision par ordinateur. Pour prouver ce point, les scientifiques ont utilisé la méthode STEAL pour affiner Cityscapes - un ensemble de données avec un contenu lié à l'environnement urbain - présenté pour la première fois lors de la conférence Machine Vision Computer Vision and Pattern Recognition (CVPR) en 2016.
Actuellement sur GitHub , le framework STEAL peut apprendre et prédire chaque coin d'un objet en pixels de manière relativement précise en utilisant une méthode que les chercheurs appellent « alignement actif ». Un raisonnement explicite sur le bruit d'annotation pendant la formation et des formules de définition de niveau pour les réseaux de neurones lors de l'apprentissage de bout en bout à partir de représentations d'étiquettes biaisées contribuent également à produire des résultats.
Capacité à identifier plus précisément les limites et les bords d'un objet
"Nous montrons en outre que nos limites de prédiction surpassent celles obtenues à partir des derniers résultats du segment DeepLab-v3, tout en utilisant uniquement l'architecture est beaucoup plus légère", a déclaré un représentant de l'équipe de recherche dans une interview approfondie avec le site d'information arXiv.
Ce travail de recherche s'intitule : "Devil is in the Edges: Learning Semantic Boundaries from Noisy Annotations", et sera largement présenté à travers une présentation dans le cadre de la conférence CVPR 2019 qui se déroule à Long Beach, en Californie. Les experts de Nvidia Research ont apporté une contribution significative à cette recherche et présenteront également spécifiquement la recherche d'un point de vue personnel lors du CVPR de cette année.

Selon des informations récemment rapportées, Nvidia a déclaré qu'il prendrait en charge les systèmes matériels informatiques hautes performances du fabricant britannique Arm en 2020, ainsi que le logiciel d'inférence d'analyse open source TensorRT sur Github pour permettre une plus grande personnalisation.