Tacotron 2, le système d'intelligence artificielle de Google, peut transformer un texte sans vie en une voix humaine. Ceci est considéré comme un grand pas en avant pour Google, aidant l’IA à se rapprocher des utilisateurs.
Pour ce faire, Tacotron 2 utilise deux intelligences artificielles aux rôles différents, la première se concentrera sur la conversion des lettres en spectrogrammes, la seconde (WaveNet) transformera ces données en son.

Découvrez la puissance exceptionnelle du nouveau système d'IA de Google en écoutant des paires de fichiers audio identiques créés par les humains et Tacotron 2. Pouvez-vous distinguer s’il s’agit d’une machine ou d’une voix humaine ?
« George Washington fut le premier président des États-Unis. »
"Cette fille a fait une vidéo sur le rouge à lèvres Star Wars."
"Les bus ne sont pas le problème, ils apportent en fait une solution."
"Les bus ne sont pas le PROBLEME, ils apportent en fait une SOLUTION."
"Réseau antagoniste génératif ou auto-encodeur variationnel."
"La membrane basilaire et l'oto-rhino-laryngologie ne sont pas des autocorrélations."
"Il a tout lu."
"Il lit des livres".
Selon les annonces actuelles, Tacotron 2 peut gérer des mots difficiles à prononcer que les gens n'ont peut-être jamais rencontrés auparavant, peut analyser pour trouver l'accent qui doit être souligné dans une phrase et souligner ce qui est écrit ou s'auto-analyser pour détecter fautes d'orthographe de base.
Le système Tacotron 2 ne crée pour l'instant qu'une seule voix féminine, parlant anglais et utilisée pour communiquer avec l'assistant virtuel Google Assistant. Il est certain qu’à l’avenir, Google créera davantage de voix et que Tacotron 2 sera appliqué à de nombreuses plateformes différentes.
En savoir plus :