Microsoft heeft zojuist officieel de inzet aangekondigd van technologie voor ondertiteling (beschrijving) van afbeeldingen op basis van kunstmatige intelligentie (AI) via het Azure Cognitive Services-serviceplatform. Een vertegenwoordiger van het bedrijf Redmond bevestigde met name vol vertrouwen dat dit AI-systeem momenteel beelden kan beschrijven met een nauwkeurigheid die niet onderdoet voor die van mensen, in sommige gevallen zelfs nauwkeuriger, en natuurlijk met een veel hogere productiviteit.
Deze nieuwe technologie belooft een krachtige assistent te worden, die ontwikkelaars helpt de toegankelijkheidsfuncties en de gebruikerservaring in hun eigen applicatieomgevingen te verbeteren. Met door AI aangestuurde beeldannotatie kunnen gebruikers snel belangrijke inhoud in afbeeldingen identificeren, zoals inhoud in zoekresultaten en foto's in presentaties, via annotaties. Snelle likes gegenereerd door AI zonder dat dit veel tijd kost. Microsoft waarschuwt echter ook dat de annotaties die AI biedt misschien niet altijd perfect zijn, en in de loop van de tijd geleidelijk zullen moeten worden verbeterd.
Belangrijker nog is dat Saqib Shaikh, directeur software-engineering bij de AI-platformgroep van Microsoft, zei dat ondertiteling bij afbeeldingen mensen met een visuele beperking aanzienlijk kan helpen door fotobeschrijvingen, gewoonlijk asalt-tekst genoemd, op een webpagina of document te plaatsen. Daarnaast gebruikt het team van Shaikh ook het camerasysteem Seeing AI om beelden te beschrijven voor mensen die blind of slechtziend zijn.
“Ons idee bij de ontwikkeling van dit AI-systeem is om de meest nauwkeurige beschrijving te geven van elke afbeelding die in documenten, op internet of op sociale-mediaplatforms verschijnt... Hierdoor kunnen mensen met een visuele beperking gemakkelijk foto-inhoud begrijpen en online deelnemen communicatie met meer vertrouwen.”
Video waarin het automatische fotoannotatiesysteem wordt geïntroduceerd:
Zoals onthuld door Microsoft is dit nieuwe systeem twee keer zo efficiënt als het oude beeldannotatiemodel dat sinds 2015 wordt gebruikt, zowel qua nauwkeurigheid als productiviteit.
Later dit jaar zal deze door AI aangedreven technologie voor ondertiteling van afbeeldingen ook worden geïntegreerd in Microsoft Word en Outlook voor Windows- en Mac- platforms , evenals in PowerPoint voor Windows, Mac en het web.