Facebook heeft AI gemaakt die 100 verschillende talen kan vertalen, zonder eerst door het Engels te hoeven gaan

Facebook heeft zojuist een AI-model open source gemaakt met indrukwekkende vertaalmogelijkheden in maximaal 100 talen, zonder dat deze als tussenstap eerst naar het Engels hoeven te worden vertaald, wat vaak wordt aangetroffen bij vertaaltools die zijn gebaseerd op de hedendaagse kunstmatige intelligentie.

Dit AI-model heet M2M-100 en bevindt zich momenteel alleen op onderzoeksprojectniveau. Zodra de ontwikkelingsfasen echter zijn voltooid (in de nabije toekomst), kan het worden gebruikt om de taak van het vertalen van berichten en opmerkingen van Facebook-gebruikers volledig op te lossen - vanuit verschillende talen in verschillende talen over de hele wereld. Volgens de laatste statistieken gebruikt momenteel meer dan 2/3 van de Facebook-gebruikers geen Engels om op dit sociale netwerkplatform te communiceren.

“Onze AI-onderzoekers hebben vele jaren hard gewerkt om één enkel algemeen model te bouwen en te ontwikkelen dat een verscheidenheid aan talen kan begrijpen in een verscheidenheid aan situaties en taken. Eén enkel model dat alle talen, dialecten en voortdurend bijgewerkte en geoptimaliseerde vertalingen ondersteunt, zal ons helpen een betere ervaring te bieden aan miljarden Facebook-gebruikers ”, aldus onderzoeker AI Facebook Angela Fan in een bericht op blogpost.al.

Het nieuwe AI-model kan veel verschillende soorten vertalingen op Facebook ondersteunen

M2M-100 is getraind op een dataset van 7,5 miljard veelvoorkomende zinsparen uit 100 verschillende talen, allemaal verzameld via internet. Facebook zegt dat de bronnen allemaal open source zijn en gebruik maken van openbare gegevens.

Om zo’n grootschalige trainingsdatabase te beheren, richten Facebook AI-onderzoekers zich vooral op de meest gevraagde taalvertalingen, terwijl ze zeldzame zinnen en talen beperken. Ze zullen deze talen vervolgens in 14 verschillende groepen groeperen, op basis van taalkundige, geografische en culturele overeenkomsten. Deze aanpak wordt als optimaal beschouwd omdat mensen in landen die de bovengenoemde gemeenschappelijke kenmerken delen, meer zullen profiteren van geoptimaliseerde vertalingen in een bepaalde taalgroep.

Talen die tot verschillende groepen behoren, zullen met elkaar verbonden worden via een klein aantal brugtalen. In het voorbeeld van de Indiase taalgroep fungeren Hindi, Bengaals en Tamil als brugtalen voor de Indo-Arische talen. Door het hele verzamel- en selectieproces zijn de onderzoekers tot een dataset gekomen die bestaat uit 7,5 miljard parallelle zinnen, wat overeenkomt met 2.200 vertaalrichtingen.

Voor talen die geen kwalitatieve vertaalgegevens hebben, hebben onderzoekers een methode gebruikt die back-translation wordt genoemd om synthetische vertalingen te creëren die de verzamelde gegevens kunnen aanvullen.

Over het geheel genomen resulteerde de combinatie van deze technieken in 's werelds eerste meertalige machinevertalingsmodel (MMT) dat tussen 100 talen kan vertalen zonder afhankelijk te zijn van gegevens. Engels is de standaard, aldus een verklaring van Facebook.

"Normaal gesproken zullen de meeste huidige meertalige vertaalmodellen bij het vertalen van Chinees naar Frans Engels-gericht zijn, ze zullen Chinees naar Engels en van Engels naar Frans vertalen, omdat Engelse trainingsgegevens het meest beschikbaar en populair zijn. In plaats daarvan zijn Engelse trainingsgegevens het meest beschikbaar en ook populair. Door dit motief te volgen, vertaalt ons model Chinese gegevens rechtstreeks naar het Frans om een maximale betekenis van de vertaling te garanderen.

Momenteel is M2M-100 nog in geen enkel product geïntegreerd, maar uit tests blijkt dat het veel verschillende soorten vertalingen op Facebook kan ondersteunen, waar mensen nog steeds elk uur inhoud in meer dan 160 talen plaatsen.

Laat een reactie achter

De ChatGPT-taskforce zal door Europa worden opgericht

Het orgaan dat de nationale privacywaakhonden van Europa verenigt, zei donderdag dat het een taskforce heeft opgericht die zich specifiek bezighoudt met ChatGPT

AI voorspelt het tijdstip van de menselijke dood met een nauwkeurigheid van 78%

Deense en Amerikaanse wetenschappers hebben samengewerkt om een AI-systeem te ontwikkelen genaamd life2vec, dat in staat is om het tijdstip van menselijke dood met hoge nauwkeurigheid te voorspellen.

AI voorspelt urinewegaandoeningen alleen al op basis van het geluid van urine

Een AI-algoritme genaamd Audioflow kan naar het geluid van het plassen luisteren om abnormale stromingen en bijbehorende gezondheidsproblemen van de patiënt effectief en met succes te identificeren.

Barmannen opgelet: deze robot kan in slechts 1 minuut een cocktail mixen

Door de vergrijzing en de afnemende bevolking van Japan heeft het land een aanzienlijk aantal jonge werknemers nodig, vooral in de dienstensector.

Honderden mensen waren gedesillusioneerd toen ze hoorden dat het meisje van wie ze hielden een product van AI was

Een Reddit-gebruiker genaamd u/LegalBeagle1966 is een van de vele gebruikers die verliefd zijn op Claudia, een filmsterachtig meisje dat vaak verleidelijke selfies deelt, zelfs naakte, op dit platform.

Nog twaalf potentiële bedrijven sluiten zich aan bij de AI-alliantie van Microsoft.

Microsoft heeft zojuist aangekondigd dat nog twaalf technologiebedrijven zullen deelnemen aan zijn AI for Good-programma.

AI herschept Dragon Ball-personages in vlees en bloed

Gebruiker @mortecouille92 heeft de kracht van de grafische ontwerptool Midjourney aan het werk gezet en uniek realistische versies gemaakt van beroemde Dragon Ball-personages zoals Goku, Vegeta, Bulma en oudere Kame.

7 technieken om ChatGPT-reacties te verbeteren

Door enkele voorwaarden toe te voegen of enkele scenario's in te stellen, kan ChatGPT relevantere antwoorden op uw vragen geven. Laten we eens kijken naar enkele manieren waarop u de kwaliteit van uw ChatGPT-reacties kunt verbeteren.

Bewonder de prachtige schilderijen getekend door kunstmatige intelligentie

Midjourney is een kunstmatig intelligentiesysteem dat de laatste tijd voor ‘koorts’ zorgt in de online community en de kunstenaarswereld vanwege zijn buitengewoon mooie schilderijen die niet onderdoen voor die van echte kunstenaars.

Dit AI-model was een van de eerste ‘experts’ die nieuws ontdekte over de uitbraak van Wuhan-longontsteking.

Dagen nadat China de uitbraak had aangekondigd, bleef het AI-systeem van BlueDot, met toegang tot wereldwijde gegevens over de verkoop van vliegtickets, nauwkeurig de verspreiding van het Wuhan Corona-virus naar Bangkok, Seoul, Taipei en Tokio voorspellen.