Meta apresenta Voicebox, um modelo de IA que suporta processamento de áudio para criadores

Meta apresenta Voicebox, um modelo de IA que suporta processamento de áudio para criadores

Após inúmeros rumores, a Meta finalmente anunciou oficialmente seu modelo de IA de última geração chamado Voicebox. Este modelo foi projetado para ajudar os criadores de conteúdo a lidar com eficiência com tarefas relacionadas à geração de voz, como edição de áudio, amostragem e estilização, mesmo sem treinamento específico.

Meta afirma com segurança que este novo modelo de IA “beneficiará muitas pessoas em todo o mundo”, não apenas no campo da criação de conteúdo. Por exemplo, ajudar pessoas cegas a ouvir mensagens de texto usando a voz, bem como permitir que as pessoas falem línguas estrangeiras com a própria voz.

O próprio Voicebox é anunciado como capaz de criar clipes de áudio de alta qualidade e editar clipes de áudio pré-gravados para remover interrupções indesejadas, como buzinas de carros, enquanto mantém o mesmo conteúdo e estilo multilíngue (produzindo fala em seis idiomas diferentes). Os desenvolvimentos futuros planejados pela Meta para o modelo incluem o fornecimento de vozes naturais para assistentes visuais ou personagens em jogos no metaverso.

A Meta também comparou o Voicebox com outros modelos de IA com processamento de áudio atualmente no mercado, especificamente concorrentes importantes como Vall-E e YourTTS. No geral, o modelo do Meta é avançado e supera a concorrência ao comparar a taxa de erro do Word e a similaridade do estilo.

Meta apresenta Voicebox, um modelo de IA que suporta processamento de áudio para criadores

Meta apresenta Voicebox, um modelo de IA que suporta processamento de áudio para criadores

Voicebox é baseado em Flow Matching. Este é o mais recente modelo generativo não autorregressivo do Meta, que pode lidar com mapeamento altamente não determinístico entre texto e fala. Isso permite que o Voicebox aprenda com muitos tipos diferentes de dados de fala sem precisar rotulá-los cuidadosamente, dando-lhe a oportunidade de acessar dados de treinamento mais diversos e em grande escala. Até o momento, o Voicebox foi treinado em mais de 50.000 horas de gravações de fala e transcrições de audiolivros em inglês, francês, espanhol, alemão, polonês e português.

Embora esta tecnologia possa inaugurar uma nova era de IA no processamento de áudio, Meta reconhece que pode introduzir o potencial de abuso e danos não intencionais. O artigo de pesquisa que Meta compartilhou sobre o Voicebox inclui detalhes sobre como a empresa construiu um classificador altamente eficaz que pode distinguir entre vozes autênticas e vozes geradas pelo Voicebox.

A Meta não disponibilizará o programa AI Voicebox para uso público, nem divulgará o código-fonte, pelo menos por enquanto.


A força-tarefa ChatGPT será criada pela Europa

A força-tarefa ChatGPT será criada pela Europa

O órgão que une os vigilantes nacionais da privacidade da Europa disse na quinta-feira que estabeleceu uma força-tarefa dedicada ao ChatGPT

IA prevê a hora da morte humana com 78% de precisão

IA prevê a hora da morte humana com 78% de precisão

Cientistas dinamarqueses e americanos colaboraram para desenvolver um sistema de IA chamado life2vec, capaz de prever o momento da morte humana com alta precisão.

IA prevê doenças urinárias apenas pelo som da urina

IA prevê doenças urinárias apenas pelo som da urina

Um algoritmo de IA chamado Audioflow pode ouvir o som da micção para identificar com eficácia e sucesso fluxos anormais e problemas de saúde correspondentes do paciente.

Bartenders, cuidado: este robô pode preparar um coquetel em apenas 1 minuto

Bartenders, cuidado: este robô pode preparar um coquetel em apenas 1 minuto

O envelhecimento e o declínio da população do Japão deixaram o país sem um número significativo de jovens trabalhadores, especialmente no sector dos serviços.

Centenas de pessoas ficaram desiludidas quando souberam que a garota que amavam era um produto da IA

Centenas de pessoas ficaram desiludidas quando souberam que a garota que amavam era um produto da IA

Um usuário do Reddit chamado u/LegalBeagle1966 é um dos muitos usuários apaixonados por Claudia, uma garota parecida com uma estrela de cinema que costuma compartilhar selfies sedutoras, até mesmo nuas, nesta plataforma.

Mais 12 empresas potenciais juntam-se à “aliança de IA” da Microsoft.

Mais 12 empresas potenciais juntam-se à “aliança de IA” da Microsoft.

A Microsoft acaba de anunciar que mais 12 empresas de tecnologia participarão de seu programa AI for Good.

IA recria personagens de Dragon Ball em carne e osso

IA recria personagens de Dragon Ball em carne e osso

O usuário @mortecouille92 colocou o poder da ferramenta de design gráfico Midjourney para funcionar e criou versões realistas e únicas de personagens famosos de Dragon Ball como Goku, Vegeta, Bulma e o velho Kame.

7 técnicas para melhorar as respostas do ChatGPT

7 técnicas para melhorar as respostas do ChatGPT

Apenas adicionando algumas condições ou configurando alguns cenários, o ChatGPT pode dar respostas mais relevantes às suas dúvidas. Vejamos algumas maneiras de melhorar a qualidade de suas respostas do ChatGPT.

Maravilhe-se com as belas pinturas desenhadas pela inteligência artificial

Maravilhe-se com as belas pinturas desenhadas pela inteligência artificial

Midjourney é um sistema de inteligência artificial que recentemente causou “febre” na comunidade online e no mundo dos artistas por causa de suas pinturas extremamente belas e que não são inferiores às de artistas reais.

Este modelo de IA foi um dos primeiros “especialistas” a descobrir notícias sobre o surto de pneumonia em Wuhan.

Este modelo de IA foi um dos primeiros “especialistas” a descobrir notícias sobre o surto de pneumonia em Wuhan.

Dias depois de a China anunciar o surto, com acesso a dados globais de vendas de passagens aéreas, o sistema de IA da BlueDot continuou a prever com precisão a propagação do vírus Wuhan Corona para Bangkok, Seul, Taipei e Tóquio.