Facebook a créé une IA capable de traduire 100 langues différentes, sans avoir besoin de passer par langlais au préalable

Facebook a créé une IA capable de traduire 100 langues différentes, sans avoir besoin de passer par langlais au préalable

Facebook vient de rendre open source un modèle d'IA avec des capacités de traduction impressionnantes dans jusqu'à 100 langues sans avoir besoin de les traduire d'abord en anglais comme étape intermédiaire, ce que l'on retrouve souvent sur les outils de traduction basés sur l'intelligence artificielle d'aujourd'hui.

Ce modèle d’IA s’appelle M2M-100 et n’en est actuellement qu’au niveau d’un projet de recherche. Cependant, une fois les étapes de développement terminées (dans un avenir proche), il peut être utilisé pour résoudre complètement la tâche de traduction des publications et des commentaires des utilisateurs de Facebook - à partir de différentes langues à travers le monde. Selon les dernières statistiques, actuellement plus des 2/3 des utilisateurs de Facebook n'utilisent pas l'anglais pour communiquer sur cette plateforme de réseau social.

«Nos chercheurs en IA ont travaillé dur pendant de nombreuses années pour construire et développer un modèle général unique capable de comprendre une variété de langages dans une variété de situations et de tâches. Un modèle unique prenant en charge toutes les langues, tous les dialectes et des traductions continuellement mises à jour et optimisées nous aidera à offrir une meilleure expérience à des milliards d'utilisateurs de Facebook », a déclaré la chercheuse AI Facebook Angela Fan dans un article publié sur blogpost.al.

Facebook a créé une IA capable de traduire 100 langues différentes, sans avoir besoin de passer par l'anglais au préalable

Le nouveau modèle d'IA peut prendre en charge de nombreux types de traductions sur Facebook

M2M-100 est formé sur un ensemble de données de 7,5 milliards de paires de phrases courantes provenant de 100 langues différentes, toutes collectées sur Internet. Facebook affirme que les ressources sont toutes open source et utilisent des données publiques.

Pour gérer une base de données de formation d'une telle envergure, les chercheurs de Facebook AI se concentrent principalement sur les traductions des langues les plus couramment demandées, tout en limitant les phrases rares et les langues rencontrées. Ils regrouperont ensuite ces langues en 14 groupes différents, en fonction de similitudes linguistiques, géographiques et culturelles. Cette approche est considérée comme plus optimale car les habitants des pays partageant les caractéristiques communes ci-dessus bénéficieront davantage de traductions optimisées dans un groupe linguistique donné.

Les langues appartenant à différents groupes seront reliées par un petit nombre de langues passerelles. Dans l'exemple du groupe linguistique indien, l'hindi, le bengali et le tamoul servent de langues passerelles pour les langues indo-aryennes. Tout au long du processus de collecte et de sélection, les chercheurs ont obtenu un ensemble de données composé de 7,5 milliards de phrases parallèles, correspondant à 2 200 directions de traduction.

Pour les langues dépourvues de données de traduction de qualité, les chercheurs ont utilisé une méthode appelée rétro-traduction pour créer des traductions synthétiques pouvant compléter les données extraites.

Dans l'ensemble, la combinaison de ces techniques a donné naissance au premier modèle de traduction automatique multilingue (MMT) au monde capable de traduire entre 100 langues sans recourir à des données. L'anglais est la norme, selon une déclaration de Facebook.

« Par exemple, normalement, lors de la traduction du chinois vers le français, la plupart des modèles de traduction multilingues actuels seront centrés sur l'anglais, ils traduiront le chinois vers l'anglais et de l'anglais vers le français, car les données de formation en anglais sont les plus disponibles et les plus populaires. En suivant ce motif, notre modèle traduit directement les données chinoises en français pour garantir une rétention maximale du sens de la traduction".

Actuellement, M2M-100 n'est encore intégré dans aucun produit, mais les tests montrent qu'il peut prendre en charge de nombreux types de traductions différents sur Facebook, où les gens publient encore du contenu toutes les heures dans plus de 160 langues.


Le groupe de travail ChatGPT sera créé par l’Europe

Le groupe de travail ChatGPT sera créé par l’Europe

L'organisme qui rassemble les organismes nationaux de surveillance de la vie privée en Europe a annoncé jeudi avoir créé un groupe de travail dédié à ChatGPT.

LIA prédit lheure de la mort humaine avec une précision de 78 %

LIA prédit lheure de la mort humaine avec une précision de 78 %

Des scientifiques danois et américains ont collaboré pour développer un système d'IA appelé life2vec, capable de prédire l'heure de la mort humaine avec une grande précision.

L’IA prédit les maladies urinaires rien qu’au son de l’urine

L’IA prédit les maladies urinaires rien qu’au son de l’urine

Un algorithme d’IA appelé Audioflow peut écouter le bruit de la miction pour identifier efficacement et avec succès les flux anormaux et les problèmes de santé correspondants du patient.

Barmans, attention : ce robot peut préparer un cocktail en 1 minute seulement

Barmans, attention : ce robot peut préparer un cocktail en 1 minute seulement

En raison du vieillissement et du déclin de la population japonaise, le pays manque d'un nombre important de jeunes travailleurs, notamment dans le secteur des services.

Des centaines de personnes ont été déçues lorsqu’elles ont appris que la fille qu’ils aimaient était un produit de l’IA

Des centaines de personnes ont été déçues lorsqu’elles ont appris que la fille qu’ils aimaient était un produit de l’IA

Un utilisateur de Reddit nommé u/LegalBeagle1966 est l'un des nombreux utilisateurs amoureux de Claudia, une fille ressemblant à une star de cinéma qui partage souvent des selfies séduisants, même nus, sur cette plateforme.

12 autres entreprises potentielles rejoignent « lalliance IA » de Microsoft.

12 autres entreprises potentielles rejoignent « lalliance IA » de Microsoft.

Microsoft vient d'annoncer que 12 autres entreprises technologiques participeront à son programme AI for Good.

LIA recrée les personnages de Dragon Ball en chair et en os

LIA recrée les personnages de Dragon Ball en chair et en os

L'utilisateur @mortecouille92 a mis à profit la puissance de l'outil de conception graphique Midjourney et a créé des versions réalistes uniques de personnages célèbres de Dragon Ball comme Goku, Vegeta, Bulma et l'aîné Kame. .

7 techniques pour améliorer les réponses ChatGPT

7 techniques pour améliorer les réponses ChatGPT

En ajoutant simplement quelques conditions ou en mettant en place des scénarios, ChatGPT peut donner des réponses plus pertinentes à vos requêtes. Examinons quelques façons d'améliorer la qualité de vos réponses ChatGPT.

Émerveillez-vous devant les magnifiques peintures dessinées par lintelligence artificielle

Émerveillez-vous devant les magnifiques peintures dessinées par lintelligence artificielle

Midjourney est un système d'intelligence artificielle qui a récemment provoqué une "fièvre" dans la communauté en ligne et dans le monde des artistes en raison de ses peintures extrêmement belles qui ne sont pas inférieures à celles de vrais artistes.

Ce modèle dIA a été lun des premiers « experts » à découvrir des nouvelles sur lépidémie de pneumonie de Wuhan.

Ce modèle dIA a été lun des premiers « experts » à découvrir des nouvelles sur lépidémie de pneumonie de Wuhan.

Quelques jours après que la Chine a annoncé l'épidémie, grâce à l'accès aux données mondiales sur les ventes de billets d'avion, le système d'IA de BlueDot a continué à prédire avec précision la propagation du virus Corona de Wuhan à Bangkok, Séoul, Taipei et Tokyo.