Tacotron 2, el sistema de inteligencia artificial de Google, puede convertir un texto sin vida en una voz humana. Esto se considera un gran paso adelante para Google, ya que ayuda a que la IA esté más cerca de los usuarios.
Para ello, Tacotron 2 utiliza dos inteligencias artificiales con roles diferentes, la primera se centrará en convertir letras en espectrogramas, la segunda (WaveNet) convertirá esos datos en sonido.

Experimente el extraordinario poder del nuevo sistema de inteligencia artificial de Google escuchando pares de archivos de audio idénticos creados por humanos y Tacotron 2. ¿Puedes distinguir si es una máquina o una voz humana?
"George Washington fue el primer presidente de los Estados Unidos".
"Esa chica hizo un vídeo sobre el lápiz labial de Star Wars".
"Los autobuses no son el problema, sino que ofrecen una solución".
"Los autobuses no son el PROBLEMA, en realidad brindan una SOLUCIÓN."
"Red adversaria generativa o codificador automático variacional".
"La membrana basal y la otorrinolaringología no son autocorrelaciones".
"Él lo ha leído todo".
"Él lee libros".
Según los anuncios actuales, Tacotron 2 puede manejar palabras difíciles de pronunciar que la gente quizás nunca antes haya encontrado, puede analizar para encontrar el enfoque que necesita enfatizarse en una oración y enfatizar lo que está escrito o autoanalizarse para detectar errores ortográficos básicos.
El sistema Tacotron 2 actualmente solo crea una única voz femenina, que habla inglés y se utiliza para comunicarse con el asistente virtual Google Assistant. Seguramente en el futuro Google creará más voces y Tacotron 2 se aplicará a muchas plataformas diferentes.
Ver más: