Microsoft vient d'annoncer officiellement le déploiement d'une technologie de sous-titrage (description) d'images basée sur l'intelligence artificielle (IA) via la plateforme de services Azure Cognitive Services. Notamment, un représentant de la société de Redmond a affirmé avec confiance que ce système d'IA est actuellement capable de décrire des images avec une précision non inférieure à celle des humains, voire plus précise dans certains cas, et bien sûr avec une productivité bien supérieure.
Cette nouvelle technologie promet de devenir un assistant puissant, aidant les développeurs à améliorer les fonctionnalités d'accessibilité ainsi que l'expérience utilisateur dans leurs propres environnements d'application. Grâce à l'annotation d'images basée sur l'IA, les utilisateurs peuvent identifier rapidement le contenu important des images, tel que le contenu des résultats de recherche et les photos des présentations, grâce à des annotations et des likes rapides générés par l'IA sans prendre beaucoup de temps. Cependant, Microsoft prévient également que les annotations fournies par l'IA ne sont pas toujours parfaites et devront être progressivement améliorées au fil du temps.
Plus important encore, Saqib Shaikh, directeur de l'ingénierie logicielle du groupe des plateformes d'IA de Microsoft, a déclaré que le sous-titrage d'images peut aider de manière significative les personnes malvoyantes en créant des descriptions de photos, communément appelées texte de sel, dans une page Web ou un document. En outre, l'équipe de Shaikh utilise également le système de caméra Seeing AI pour décrire des images destinées aux personnes aveugles ou malvoyantes.
« Notre idée en développant ce système d'IA est d'aider à donner la description la plus précise possible pour chaque image qui apparaît dans des documents, sur le Web ou sur les plateformes de médias sociaux... Permettant ainsi aux personnes malvoyantes de saisir facilement le contenu des photos et de participer à des activités en ligne. communications avec plus de confiance.
Vidéo présentant le système d'annotation automatique de photos :
Comme l'a révélé Microsoft, ce nouveau système est deux fois plus efficace que l'ancien modèle d'annotation d'images utilisé depuis 2015, tant en termes de précision que de productivité.
Plus tard cette année, cette technologie de sous-titrage d'images basée sur l'IA sera également intégrée aux plates-formes Microsoft Word et Outlook pour Windows et Mac , ainsi qu'à PowerPoint pour Windows, Mac et le Web.