LIA de Microsoft met trois secondes pour imiter la voix de nimporte qui

Vall-E, une IA créée par Microsoft, peut imiter le ton et le discours de vraies personnes en écoutant leur voix pendant trois secondes, même si cela ressemble toujours un peu à la voix d'un robot.

L'IA de Microsoft met trois secondes pour imiter la voix de n'importe qui

L'IA Vall-E de Microsoft. Photo d’illustration : VallE-Démo.

Ce système d'IA de Microsoft est appelé « Modèle de langage de codec neuronal ». Un codec est un outil qui utilise des algorithmes pour traiter la vidéo et la stocker dans un flux d'octets. Les fichiers audio ou vidéo sont minifiés puis décompressés à diverses fins.

Vall-E a été construit par Microsoft sur la plateforme EnCodec, un codec audio utilisant des techniques d'apprentissage automatique développées en 2022 par Meta. Vall-E crée des codecs audio uniques en capturant et en analysant l'audio de chaque personne, puis les informations sont décomposées en parties appelées « jetons » via EnCodec. Ceci est différent des méthodes de synthèse vocale précédentes, qui se présentent généralement sous forme d'onde.

Vall-E utilise ensuite les données d'entraînement pour faire correspondre ce qu'il « sait » sur l'intonation de la parole, afin de pouvoir prononcer d'autres phrases en fonction de ce qu'il a « appris ».

L’ensemble de ce processus d’imitation de la parole se déroule en trois secondes – ce qui n’a jamais été réalisé par aucun système d’IA d’imitation de langage aujourd’hui.

Microsoft utilise une bibliothèque contenant 60 000 heures d'anglais provenant de plus de 7 000 personnes pour former Vall-E. Cette bibliothèque sera complétée au fil du temps et dans davantage de langues.

Microsoft espère que Vall-E sera appliqué dans des logiciels de synthèse vocale de haute qualité.

Cependant, Vall-E fait craindre aux experts qu'il puisse être utilisé à des fins malveillantes. Cette IA peut être utilisée par des méchants pour usurper l’identité de voix à des fins de fraude et d’extorsion. Si cette IA est combinée à des vidéos deepfake, le niveau de danger peut se multiplier plusieurs fois.

Leave a Comment

Qu’est-ce que Forefront IA ? Est-ce mieux que ChatGPT ?

Qu’est-ce que Forefront IA ? Est-ce mieux que ChatGPT ?

Forefront AI est une plateforme en ligne qui permet aux entreprises et aux particuliers d’accéder à 5 LLM (grands modèles de langage) différents : GPT-3.5, GPT-4, Claude Instant 1.2, Claude 2 et Forefront.

Comment créer des modèles personnalisés dans DocuSign

Comment créer des modèles personnalisés dans DocuSign

Découvrez comment créer des modèles personnalisés dans DocuSign pour faciliter vos processus de signature numérique. Apprenez à configurer un document pour vos fournisseurs et à gérer les messages.

Les applications d’IA peuvent diagnostiquer les maladies sexuellement transmissibles uniquement grâce aux images

Les applications d’IA peuvent diagnostiquer les maladies sexuellement transmissibles uniquement grâce aux images

Les applications d'IA comme celles développées par HeHealth révolutionnent le diagnostic des maladies sexuellement transmissibles, offrant des solutions pratiques et confidentielles.

Le groupe de travail ChatGPT sera créé par l’Europe

Le groupe de travail ChatGPT sera créé par l’Europe

L'organisme qui rassemble les organismes nationaux de surveillance de la vie privée en Europe a annoncé jeudi avoir créé un groupe de travail dédié à ChatGPT.

LIA prédit lheure de la mort humaine avec une précision de 78 %

LIA prédit lheure de la mort humaine avec une précision de 78 %

Des scientifiques danois et américains ont collaboré pour développer un système d'IA appelé life2vec, capable de prédire l'heure de la mort humaine avec une grande précision.

L’IA prédit les maladies urinaires rien qu’au son de l’urine

L’IA prédit les maladies urinaires rien qu’au son de l’urine

Un algorithme d’IA appelé Audioflow peut écouter le bruit de la miction pour identifier efficacement et avec succès les flux anormaux et les problèmes de santé correspondants du patient.

Barmans, attention : ce robot peut préparer un cocktail en 1 minute seulement

Barmans, attention : ce robot peut préparer un cocktail en 1 minute seulement

En raison du vieillissement et du déclin de la population japonaise, le pays manque d'un nombre important de jeunes travailleurs, notamment dans le secteur des services.

Des centaines de personnes ont été déçues lorsqu’elles ont appris que la fille qu’ils aimaient était un produit de l’IA

Des centaines de personnes ont été déçues lorsqu’elles ont appris que la fille qu’ils aimaient était un produit de l’IA

Un utilisateur de Reddit nommé u/LegalBeagle1966 est l'un des nombreux utilisateurs amoureux de Claudia, une fille ressemblant à une star de cinéma qui partage souvent des selfies séduisants, même nus, sur cette plateforme.

12 autres entreprises potentielles rejoignent « lalliance IA » de Microsoft.

12 autres entreprises potentielles rejoignent « lalliance IA » de Microsoft.

Microsoft vient d'annoncer que 12 autres entreprises technologiques participeront à son programme AI for Good.

LIA recrée les personnages de Dragon Ball en chair et en os

LIA recrée les personnages de Dragon Ball en chair et en os

L'utilisateur @mortecouille92 a mis à profit la puissance de l'outil de conception graphique Midjourney et a créé des versions réalistes uniques de personnages célèbres de Dragon Ball comme Goku, Vegeta, Bulma et l'aîné Kame. .