Meta presenta Voicebox, un modelo de inteligencia artificial que admite el procesamiento de audio para creadores

Meta presenta Voicebox, un modelo de inteligencia artificial que admite el procesamiento de audio para creadores

Después de innumerables rumores, Meta finalmente anunció oficialmente su modelo de IA de última generación llamado Voicebox. Este modelo está diseñado para ayudar a los creadores de contenido a manejar de manera eficiente tareas relacionadas con la generación de voz, como la edición, el muestreo y la estilización de audio, incluso sin una capacitación específica.

Meta afirma con seguridad que este nuevo modelo de IA "beneficiará a muchas personas en todo el mundo", no sólo en el ámbito de la creación de contenidos. Por ejemplo, ayudar a las personas ciegas a escuchar mensajes de texto usando su voz, así como permitir que las personas hablen idiomas extranjeros con su propia voz.

Se anuncia que Voicebox es capaz de crear clips de audio de alta calidad y editar clips de audio pregrabados para eliminar interrupciones no deseadas, como bocinas de automóviles, manteniendo el mismo contenido y estilo multilingüe (produciendo voz en seis idiomas diferentes). Los desarrollos futuros planificados por Meta para el modelo incluyen proporcionar voces naturales para asistentes visuales o personajes en juegos del metaverso.

Meta también comparó Voicebox con otros modelos de IA con procesamiento de audio actualmente en el mercado, específicamente competidores clave como Vall-E y YourTTS. En general, el modelo de Meta es avanzado y supera a la competencia al comparar la tasa de error de Word y la similitud de estilo.

Meta presenta Voicebox, un modelo de inteligencia artificial que admite el procesamiento de audio para creadores

Meta presenta Voicebox, un modelo de inteligencia artificial que admite el procesamiento de audio para creadores

Voicebox se basa en Flow Matching. Este es el último modelo generativo no autorregresivo de Meta, que puede manejar un mapeo altamente no determinista entre texto y voz. Esto permite a Voicebox aprender de muchos tipos diferentes de datos de voz sin tener que etiquetarlos cuidadosamente, lo que le brinda la oportunidad de acceder a datos de entrenamiento más diversos y a gran escala. Hasta la fecha, Voicebox ha recibido capacitación en más de 50.000 horas de grabaciones de voz y transcripciones de audiolibros en inglés, francés, español, alemán, polaco y portugués.

Si bien esta tecnología podría marcar el comienzo de una nueva era de IA en el procesamiento de audio, Meta reconoce que podría introducir la posibilidad de abuso y daño no intencionado. El artículo de investigación que Meta compartió sobre Voicebox incluye detalles sobre cómo la empresa creó un clasificador altamente eficaz que puede distinguir entre voces auténticas y voces generadas por Voicebox.

Meta no pondrá el programa AI Voicebox a disposición del público, ni publicará el código fuente, al menos por ahora.


Europa establecerá el grupo de trabajo ChatGPT

Europa establecerá el grupo de trabajo ChatGPT

El organismo que une a los organismos nacionales de vigilancia de la privacidad de Europa dijo el jueves que había creado un grupo de trabajo dedicado a ChatGPT.

La IA predice la hora de la muerte humana con un 78% de precisión

La IA predice la hora de la muerte humana con un 78% de precisión

Científicos daneses y estadounidenses han colaborado para desarrollar un sistema de inteligencia artificial llamado life2vec, capaz de predecir el momento de la muerte humana con gran precisión.

La IA predice enfermedades urinarias sólo por el sonido de la orina

La IA predice enfermedades urinarias sólo por el sonido de la orina

Un algoritmo de inteligencia artificial llamado Audioflow puede escuchar el sonido de la micción para identificar de manera efectiva y exitosa los flujos anormales y los correspondientes problemas de salud del paciente.

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

El envejecimiento y la disminución de la población de Japón han dejado al país sin un número significativo de trabajadores jóvenes, especialmente en el sector de servicios.

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

Un usuario de Reddit llamado u/LegalBeagle1966 es uno de los muchos usuarios enamorados de Claudia, una chica con apariencia de estrella de cine que a menudo comparte seductores selfies, incluso desnudos, en esta plataforma.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

Microsoft acaba de anunciar que 12 empresas tecnológicas más participarán en su programa AI for Good.

La IA recrea personajes de Dragon Ball en carne y hueso

La IA recrea personajes de Dragon Ball en carne y hueso

El usuario @mortecouille92 ha puesto a trabajar el poder de la herramienta de diseño gráfico Midjourney y ha creado versiones excepcionalmente realistas de personajes famosos de Dragon Ball como Goku, Vegeta, Bulma y el anciano Kame. .

7 técnicas para mejorar las respuestas de ChatGPT

7 técnicas para mejorar las respuestas de ChatGPT

Con solo agregar algunas condiciones o configurar algunos escenarios, ChatGPT puede brindar respuestas más relevantes a sus consultas. Veamos algunas formas en que puede mejorar la calidad de sus respuestas de ChatGPT.

Maravíllate ante las hermosas pinturas dibujadas por inteligencia artificial

Maravíllate ante las hermosas pinturas dibujadas por inteligencia artificial

Midjourney es un sistema de inteligencia artificial que recientemente ha causado "fiebre" en la comunidad en línea y en el mundo de los artistas debido a sus pinturas extremadamente hermosas que no son inferiores a las de artistas reales.

Este modelo de IA fue uno de los primeros expertos en descubrir noticias sobre el brote de neumonía de Wuhan.

Este modelo de IA fue uno de los primeros expertos en descubrir noticias sobre el brote de neumonía de Wuhan.

Días después de que China anunciara el brote, con acceso a datos mundiales de ventas de billetes de avión, el sistema de inteligencia artificial de BlueDot siguió prediciendo con precisión la propagación del virus Wuhan Corona a Bangkok, Seúl, Taipei y Tokio.