La IA de Microsoft tarda tres segundos en imitar la voz de cualquier persona

Vall-E, una IA creada por Microsoft, puede imitar el tono y el habla de personas reales escuchando su voz durante tres segundos, aunque seguirá sonando un poco como la voz de un robot.

La IA Vall-E de Microsoft. Foto de ilustración: VallE-Demo.

Este sistema de inteligencia artificial de Microsoft se llama "modelo de lenguaje de códec neuronal". Un códec es una herramienta que utiliza algoritmos para procesar vídeo y almacenarlo en un flujo de bytes. Los archivos de audio o vídeo se minimizan y luego se descomprimen para diversos fines.

Vall-E fue construido por Microsoft sobre la plataforma EnCodec, un códec de audio que utiliza técnicas de aprendizaje automático desarrollado en 2022 por Meta. Vall-E crea códecs de audio únicos capturando y analizando el audio de cada persona, luego la información se divide en partes llamadas "tokens" a través de EnCodec. Esto es diferente de los métodos anteriores de conversión de texto a voz, que suelen ser en forma de onda.

Luego, Vall-E utiliza los datos de entrenamiento para comparar lo que "sabe" sobre la entonación del habla, de modo que pueda decir otras frases de acuerdo con lo que "aprendió".

Todo este proceso de imitación del habla se realiza en tres segundos, algo nunca antes logrado por ningún sistema de inteligencia artificial de imitación del lenguaje en la actualidad.

Microsoft utiliza una biblioteca que contiene 60.000 horas de inglés de más de 7.000 personas para formar a Vall-E. Esta biblioteca se agregará con el tiempo y en más idiomas.

Microsoft espera que Vall-E se aplique en software de conversión de texto a voz de alta calidad.

Sin embargo, Vall-E hace temer a los expertos que pueda utilizarse con fines maliciosos. Los malos pueden utilizar esta IA para hacerse pasar por voces con fines de fraude y extorsión. Si esta IA se combina con vídeos deepfake, el nivel de peligro puede multiplicarse muchas veces.

Tags: #Artificial Intelligence (AI)

Los restaurantes de sushi japoneses utilizan IA para evaluar la calidad de cada trozo de atún con gran precisión

Una cadena de restaurantes de sushi japonesa llamada Dentsu Inc acaba de desarrollar con éxito una aplicación llamada Tuna Scope, que utiliza IA para evaluar la calidad del atún con un alto nivel de precisión, no inferior al de los chefs más experimentados.

Una mirada a los precios de Slack: un breve recorrido por los planes de Slacks

Slack ha adoptado el modelo de negocio SaaS y ofrece varios planes diferentes para satisfacer las necesidades de su organización. He aquí un breve recorrido por las opciones.

¿Qué es Claude Pro? ¿Cómo se compara Claude Pro con ChatGPT Plus?

Descubre Claude Pro, la versión premium de Claude AI Chatbot, y cómo se compara con ChatGPT Plus, optimizando tu experiencia en inteligencia artificial.

Europa establecerá el grupo de trabajo ChatGPT

El organismo que une a los organismos nacionales de vigilancia de la privacidad de Europa dijo el jueves que había creado un grupo de trabajo dedicado a ChatGPT.

La IA predice la hora de la muerte humana con un 78% de precisión

Científicos daneses y estadounidenses han colaborado para desarrollar un sistema de inteligencia artificial llamado life2vec, capaz de predecir el momento de la muerte humana con gran precisión.

La IA predice enfermedades urinarias sólo por el sonido de la orina

Un algoritmo de inteligencia artificial llamado Audioflow puede escuchar el sonido de la micción para identificar de manera efectiva y exitosa los flujos anormales y los correspondientes problemas de salud del paciente.

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

El envejecimiento y la disminución de la población de Japón han dejado al país sin un número significativo de trabajadores jóvenes, especialmente en el sector de servicios.

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

Un usuario de Reddit llamado u/LegalBeagle1966 es uno de los muchos usuarios enamorados de Claudia, una chica con apariencia de estrella de cine que a menudo comparte seductores selfies, incluso desnudos, en esta plataforma.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

Microsoft acaba de anunciar que 12 empresas tecnológicas más participarán en su programa AI for Good.

La IA recrea personajes de Dragon Ball en carne y hueso

El usuario @mortecouille92 ha puesto a trabajar el poder de la herramienta de diseño gráfico Midjourney y ha creado versiones excepcionalmente realistas de personajes famosos de Dragon Ball como Goku, Vegeta, Bulma y el anciano Kame. .

La IA de Microsoft tarda tres segundos en imitar la voz de cualquier persona

Leave a Comment

Los restaurantes de sushi japoneses utilizan IA para evaluar la calidad de cada trozo de atún con gran precisión

Una mirada a los precios de Slack: un breve recorrido por los planes de Slacks

¿Qué es Claude Pro? ¿Cómo se compara Claude Pro con ChatGPT Plus?

Europa establecerá el grupo de trabajo ChatGPT

La IA predice la hora de la muerte humana con un 78% de precisión

La IA predice enfermedades urinarias sólo por el sonido de la orina

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

La IA recrea personajes de Dragon Ball en carne y hueso