Onderzoekers van het Amerikaanse Allen Institute for Artificial Intelligence hebben een nieuwe AI2 gemaakt die foto's met beschrijvende tekst kan genereren. Deze AI is gemaakt op basis van een computervisiemodel dat annoteert wat het in een foto "ziet", maar het algoritme omkeert om op basis van de beschrijving een afbeelding te maken. Hoewel de door AI gemaakte beelden een beetje "eng" zijn, vormen ze een nieuwe stap voorwaarts in de kunstmatige intelligentie.
Volgens MIT Technology Review is het genereren van afbeeldingen uit beschrijvingen een spannend onderzoeksgebied. Een foto in tekst omschrijven is zelfs voor kinderen vrij eenvoudig, maar het omgekeerde is niet eenvoudig.

Afbeelding van "een zebra die over de weg loopt terwijl twee auto's voorbij razen" is gemaakt door AI2.
Onderzoekers van het Allen Institute hebben een beeldannotatiemodel gemaakt met de naam Lxmert en hebben dit vervolgens geüpgraded naar X-Lxmert. Hoewel het getoonde op de foto door Lxmert niet nauwkeurig en ‘coherent’ wordt beschreven, is de foto-inhoud niet geheel ‘betekenisloos’.
Vervolgens vroegen de onderzoekers de AI om van die beschrijvingen een foto te maken. Hoewel bijna geen van de foto's voltooid was, maakten de resultaten indruk op de onderzoekers. Deze AI komt niet met een perfect product voor sommige trefwoorden, zoals 'fotograaf', 'fotostudio' of 'camera', maar het is nog steeds een ongelooflijke stap voorwaarts op het gebied van kunstmatige intelligentie, waaruit blijkt dat er nog gaten bestaan door de AI-industrie zullen in de toekomst ‘opgevuld’ worden.
Onvoltooide "camera op tafel" afbeelding van AI2.
Bovendien kan deze richting het enorme potentieel van AI ontsluiten bij gebruik in de film- en schilderindustrie.