Meta memperkenalkan Voicebox, model AI yang menyokong pemprosesan audio untuk pencipta

Meta memperkenalkan Voicebox, model AI yang menyokong pemprosesan audio untuk pencipta

Selepas khabar angin yang tidak terkira banyaknya, Meta akhirnya secara rasmi mengumumkan model AI generasi terbarunya yang dipanggil Voicebox. Model ini direka bentuk untuk membantu pencipta kandungan mengendalikan tugas berkaitan penjanaan suara dengan cekap seperti penyuntingan audio, pensampelan dan penggayaan, walaupun tanpa latihan khusus. mungkin melalui data dalam konteks.

Meta dengan yakin mengesahkan bahawa model AI baharu ini akan "memanfaat ramai orang di seluruh dunia", bukan hanya dalam bidang penciptaan kandungan. Contohnya, membantu orang buta mendengar mesej teks menggunakan suara mereka, serta membenarkan orang bercakap bahasa asing dengan suara mereka sendiri.

Kotak suara sendiri diiklankan sebagai boleh mencipta klip audio berkualiti tinggi dan mengedit klip audio prarakam untuk mengalih keluar gangguan yang tidak diingini, seperti hon kereta, sambil mengekalkan kandungan dan gaya berbilang bahasa yang sama, (menghasilkan pertuturan dalam enam bahasa berbeza). Perkembangan masa depan Meta yang dirancang untuk model itu termasuk menyediakan suara semula jadi untuk pembantu visual atau watak dalam permainan dalam metaverse.

Meta juga membandingkan Voicebox dengan model AI dikuasakan pemprosesan audio lain yang sedang berada di pasaran, khususnya pesaing utama seperti Vall-E dan YourTTS. Secara keseluruhan, model Meta adalah maju dan mengatasi prestasi persaingan apabila membandingkan kadar ralat Word dan persamaan Gaya.

Meta memperkenalkan Voicebox, model AI yang menyokong pemprosesan audio untuk pencipta

Meta memperkenalkan Voicebox, model AI yang menyokong pemprosesan audio untuk pencipta

Kotak Suara dibina pada Padanan Aliran. Ini ialah model generatif bukan autoregresif terbaru Meta, yang boleh mengendalikan pemetaan yang sangat tidak menentukan antara teks dan pertuturan. Ini membolehkan Voicebox belajar daripada pelbagai jenis data pertuturan tanpa perlu melabelkannya dengan teliti, memberikannya peluang untuk mengakses data latihan yang lebih pelbagai dan berskala besar. Sehingga kini, Voicebox telah dilatih mengenai lebih daripada 50,000 jam rakaman pertuturan dan transkripsi buku audio dalam bahasa Inggeris, Perancis, Sepanyol, Jerman, Poland dan Portugis.

Walaupun teknologi ini boleh membawa kepada era baharu AI dalam pemprosesan audio, Meta mengakui bahawa ia boleh memperkenalkan potensi penyalahgunaan dan bahaya yang tidak diingini. Kertas penyelidikan Meta kongsikan tentang Voicebox termasuk butiran tentang cara syarikat membina pengelas yang sangat berkesan yang boleh membezakan antara suara tulen dan suara yang dijana oleh Voicebox.

Meta tidak akan menjadikan program AI ​​Voicebox tersedia untuk kegunaan awam, dan ia juga tidak akan mengeluarkan kod sumber, sekurang-kurangnya buat masa ini.


Pasukan petugas ChatGPT akan ditubuhkan oleh Eropah

Pasukan petugas ChatGPT akan ditubuhkan oleh Eropah

Badan yang menyatukan pemerhati privasi negara Eropah berkata pada hari Khamis ia telah menubuhkan pasukan petugas khusus untuk ChatGPT

AI meramalkan masa kematian manusia dengan ketepatan 78%.

AI meramalkan masa kematian manusia dengan ketepatan 78%.

Para saintis Denmark dan Amerika telah bekerjasama untuk membangunkan sistem AI yang dipanggil life2vec, yang mampu meramalkan masa kematian manusia dengan ketepatan yang tinggi.

AI meramalkan penyakit kencing hanya dengan bunyi air kencing

AI meramalkan penyakit kencing hanya dengan bunyi air kencing

Algoritma AI yang dipanggil Audioflow boleh mendengar bunyi kencing untuk mengenal pasti aliran tidak normal dan masalah kesihatan pesakit yang sepadan dengan berkesan dan berjaya.

Pelayan bar, berhati-hati: Robot ini boleh mencampurkan koktel dalam masa 1 minit sahaja

Pelayan bar, berhati-hati: Robot ini boleh mencampurkan koktel dalam masa 1 minit sahaja

Penduduk Jepun yang semakin tua dan semakin berkurangan menyebabkan negara itu kekurangan sejumlah besar pekerja muda, terutamanya dalam sektor perkhidmatan.

Beratus-ratus orang kecewa apabila mereka mengetahui bahawa gadis yang mereka cintai adalah produk AI

Beratus-ratus orang kecewa apabila mereka mengetahui bahawa gadis yang mereka cintai adalah produk AI

Pengguna Reddit bernama u/LegalBeagle1966 ialah salah satu daripada ramai pengguna yang terpikat dengan Claudia, seorang gadis seperti bintang filem yang sering berkongsi swafoto yang menggoda, malah bogel. di platform ini.

12 lagi syarikat berpotensi menyertai AI alliance Microsoft.

12 lagi syarikat berpotensi menyertai AI alliance Microsoft.

Microsoft baru sahaja mengumumkan bahawa 12 lagi syarikat teknologi akan mengambil bahagian dalam program AI for Goodnya.

AI mencipta semula watak Dragon Ball dalam daging dan darah

AI mencipta semula watak Dragon Ball dalam daging dan darah

Pengguna @mortecouille92 telah meletakkan kuasa alat reka bentuk grafik Midjourney untuk berfungsi dan mencipta versi unik realistik watak Dragon Ball yang terkenal seperti Goku, Vegeta, Bulma dan Kame yang lebih tua. .

7 teknik untuk meningkatkan respons ChatGPT

7 teknik untuk meningkatkan respons ChatGPT

Hanya dengan menambah beberapa syarat atau menyediakan beberapa senario, ChatGPT boleh memberikan jawapan yang lebih berkaitan kepada pertanyaan anda. Mari lihat beberapa cara anda boleh meningkatkan kualiti respons ChatGPT anda.

Kagum dengan lukisan cantik yang dilukis oleh kecerdasan buatan

Kagum dengan lukisan cantik yang dilukis oleh kecerdasan buatan

Midjourney ialah sistem kecerdasan buatan yang baru-baru ini menyebabkan "demam" dalam komuniti dalam talian dan dunia artis kerana lukisannya yang sangat cantik yang tidak kalah dengan lukisan artis sebenar.

Model AI ini adalah salah seorang pakar pertama yang menemui berita tentang wabak pneumonia Wuhan.

Model AI ini adalah salah seorang pakar pertama yang menemui berita tentang wabak pneumonia Wuhan.

Beberapa hari selepas China mengumumkan wabak itu, dengan akses kepada data jualan tiket penerbangan global, sistem AI BlueDot terus meramalkan dengan tepat penyebaran virus Wuhan Corona ke Bangkok, Seoul, Taipei dan Tokyo.