Meta introduce Voicebox, un model AI care acceptă procesarea audio pentru creatori

Meta introduce Voicebox, un model AI care acceptă procesarea audio pentru creatori

După nenumărate zvonuri, Meta și-a anunțat în cele din urmă oficial modelul AI de ultima generație numit Voicebox. Acest model este conceput pentru a ajuta creatorii de conținut să gestioneze eficient sarcinile legate de generarea vocii, cum ar fi editarea audio, eșantionarea și stilizarea, chiar și fără antrenament specific posibil prin date în context.

Meta afirmă cu încredere că acest nou model de inteligență artificială va „beneficia mulți oameni din întreaga lume”, nu doar în domeniul creării de conținut. De exemplu, ajutând persoanele nevăzătoare să audă mesajele text folosind vocea lor, precum și le permite oamenilor să vorbească limbi străine cu propria lor voce.

Voicebox în sine este promovat ca fiind capabil atât de a crea clipuri audio de înaltă calitate, cât și de a edita clipuri audio preînregistrate pentru a elimina întreruperile nedorite, cum ar fi claxonele mașinii, păstrând în același timp același conținut și stil multilingv (producând vorbire în șase limbi diferite). Evoluțiile viitoare planificate de Meta pentru model includ furnizarea de voci naturale pentru asistenți vizuali sau personaje în jocurile din metavers.

Meta a comparat, de asemenea, Voicebox cu alte modele AI alimentate de procesare audio aflate în prezent pe piață, în special concurenți cheie precum Vall-E și YourTTS. În general, modelul Meta este avansat și depășește concurența atunci când compară rata de eroare Word și similaritatea stilului.

Meta introduce Voicebox, un model AI care acceptă procesarea audio pentru creatori

Meta introduce Voicebox, un model AI care acceptă procesarea audio pentru creatori

Voicebox este construit pe Flow Matching. Acesta este cel mai recent model generativ neautoregresiv al Meta, care poate gestiona maparea foarte nedeterministă între text și vorbire. Acest lucru permite Voicebox să învețe din multe tipuri diferite de date de vorbire fără a fi nevoie să le eticheteze cu atenție, oferindu-i posibilitatea de a accesa date de antrenament mai diverse și la scară largă. Până în prezent, Voicebox a fost instruit cu privire la peste 50.000 de ore de înregistrări de vorbire și transcriere de cărți audio în engleză, franceză, spaniolă, germană, poloneză și portugheză.

În timp ce această tehnologie ar putea introduce o nouă eră a AI în procesarea audio, Meta recunoaște că ar putea introduce potențialul de abuz și vătămare neintenționată. Lucrarea de cercetare pe care Meta a împărtășit-o despre Voicebox include detalii despre modul în care compania a construit un clasificator extrem de eficient care poate face distincția între vocile autentice și vocile generate de Voicebox.

Meta nu va face programul AI Voicebox disponibil pentru uz public și nici nu va elibera codul sursă, cel puțin deocamdată.


Grupul de lucru ChatGPT va fi înființat de Europa

Grupul de lucru ChatGPT va fi înființat de Europa

Organismul care reunește organele naționale de supraveghere a vieții private din Europa a declarat joi că a înființat un grup operativ dedicat ChatGPT

AI prezice ora morții umane cu o precizie de 78%.

AI prezice ora morții umane cu o precizie de 78%.

Oamenii de știință danezi și americani au colaborat pentru a dezvolta un sistem AI numit life2vec, capabil să prezică ora morții umane cu mare precizie.

AI prezice bolile urinare doar prin sunetul urinei

AI prezice bolile urinare doar prin sunetul urinei

Un algoritm AI numit Audioflow poate asculta sunetul urinării pentru a identifica eficient și cu succes fluxurile anormale și problemele de sănătate corespunzătoare ale pacientului.

Barmani, atenție: acest robot poate amesteca un cocktail în doar 1 minut

Barmani, atenție: acest robot poate amesteca un cocktail în doar 1 minut

Îmbătrânirea și scăderea populației din Japonia a lăsat țara lipsită de un număr semnificativ de tineri lucrători, în special în sectorul serviciilor.

Sute de oameni au fost dezamăgiți când au aflat că fata pe care o iubeau este un produs al inteligenței artificiale

Sute de oameni au fost dezamăgiți când au aflat că fata pe care o iubeau este un produs al inteligenței artificiale

Un utilizator Reddit numit u/LegalBeagle1966 este unul dintre mulți utilizatori îndrăgostiți de Claudia, o fată asemănătoare vedetei de cinema care deseori împărtășește selfie-uri seducătoare, chiar și nud, pe această platformă.

Încă 12 companii potențiale se alătură „alianței AI” a Microsoft.

Încă 12 companii potențiale se alătură „alianței AI” a Microsoft.

Microsoft tocmai a anunțat că alte 12 companii de tehnologie vor participa la programul său AI for Good.

AI recreează personajele Dragon Ball în carne și oase

AI recreează personajele Dragon Ball în carne și oase

Utilizatorul @mortecouille92 a pus în funcțiune puterea instrumentului de design grafic Midjourney și a creat versiuni realiste unice ale personajelor celebre Dragon Ball precum Goku, Vegeta, Bulma și bătrânul Kame. .

7 tehnici pentru a îmbunătăți răspunsurile ChatGPT

7 tehnici pentru a îmbunătăți răspunsurile ChatGPT

Doar prin adăugarea unor condiții sau configurarea unor scenarii, ChatGPT poate oferi răspunsuri mai relevante la întrebările dvs. Să vedem câteva modalități prin care puteți îmbunătăți calitatea răspunsurilor dvs. ChatGPT.

Minunați-vă de tablourile frumoase desenate de inteligența artificială

Minunați-vă de tablourile frumoase desenate de inteligența artificială

Midjourney este un sistem de inteligență artificială care a provocat recent o „febră” în comunitatea online și în lumea artiștilor din cauza picturilor sale extrem de frumoase, care nu sunt inferioare celor ale artiștilor adevărați.

Acest model AI a fost unul dintre primii „experți” care au descoperit știri despre focarul de pneumonie din Wuhan.

Acest model AI a fost unul dintre primii „experți” care au descoperit știri despre focarul de pneumonie din Wuhan.

La câteva zile după ce China a anunțat focarul, având acces la datele globale despre vânzările de bilete de avion, sistemul AI al BlueDot a continuat să prezică cu exactitate răspândirea virusului Wuhan Corona la Bangkok, Seul, Taipei și Tokyo.