Meta introduceert Voicebox, een AI-model dat audioverwerking voor makers ondersteunt

Na talloze geruchten heeft Meta eindelijk officieel haar nieuwste generatie AI-model aangekondigd, genaamd Voicebox. Dit model is ontworpen om makers van inhoud te helpen bij het efficiënt uitvoeren van taken die verband houden met het genereren van spraak, zoals audiobewerking, sampling en stilering, zelfs zonder specifieke training, mogelijk door middel van gegevens in context.

Meta bevestigt vol vertrouwen dat dit nieuwe AI-model “veel mensen over de hele wereld ten goede zal komen”, niet alleen op het gebied van contentcreatie. Bijvoorbeeld door blinden te helpen sms-berichten te horen met hun stem, maar ook door mensen met hun eigen stem vreemde talen te laten spreken.

Er wordt geadverteerd dat Voicebox zelf zowel hoogwaardige audioclips kan maken als vooraf opgenomen audioclips kan bewerken om ongewenste onderbrekingen, zoals claxons, te verwijderen, terwijl het dezelfde meertalige inhoud en stijl behoudt (waarbij spraak in zes verschillende talen wordt geproduceerd). Meta's geplande toekomstige ontwikkelingen voor het model omvatten onder meer het bieden van natuurlijke stemmen voor visuele assistenten of personages in games in de metaverse.

Meta vergeleek Voicebox ook met andere door audioverwerking aangedreven AI-modellen die momenteel op de markt zijn, met name met belangrijke concurrenten zoals Vall-E en YourTTS. Over het geheel genomen is Meta's model geavanceerd en presteert het beter dan de concurrentie bij het vergelijken van het foutenpercentage van Word en de gelijkenis van stijl.

Meta introduceert Voicebox, een AI-model dat audioverwerking voor makers ondersteunt

Voicebox is gebouwd op Flow Matching. Dit is Meta's nieuwste niet-autoregressieve generatieve model, dat zeer niet-deterministische mapping tussen tekst en spraak aankan. Hierdoor kan Voicebox leren van veel verschillende soorten spraakgegevens zonder deze zorgvuldig te hoeven labelen, waardoor het toegang krijgt tot meer diverse en grootschalige trainingsgegevens. Tot nu toe is Voicebox getraind in meer dan 50.000 uur aan spraakopnamen en transcripties van audioboeken in het Engels, Frans, Spaans, Duits, Pools en Portugees.

Hoewel deze technologie een nieuw tijdperk van AI op het gebied van audioverwerking zou kunnen inluiden, erkent Meta dat dit de mogelijkheid van misbruik en onbedoelde schade zou kunnen introduceren. Het onderzoeksartikel dat Meta deelde over Voicebox bevat details over hoe het bedrijf een zeer effectieve classificator heeft gebouwd die onderscheid kan maken tussen authentieke stemmen en stemmen gegenereerd door Voicebox.

Meta zal het AI Voicebox-programma niet beschikbaar stellen voor publiek gebruik, noch de broncode vrijgeven, althans voorlopig.

Laat een reactie achter

De ChatGPT-taskforce zal door Europa worden opgericht

Het orgaan dat de nationale privacywaakhonden van Europa verenigt, zei donderdag dat het een taskforce heeft opgericht die zich specifiek bezighoudt met ChatGPT

AI voorspelt het tijdstip van de menselijke dood met een nauwkeurigheid van 78%

Deense en Amerikaanse wetenschappers hebben samengewerkt om een AI-systeem te ontwikkelen genaamd life2vec, dat in staat is om het tijdstip van menselijke dood met hoge nauwkeurigheid te voorspellen.

AI voorspelt urinewegaandoeningen alleen al op basis van het geluid van urine

Een AI-algoritme genaamd Audioflow kan naar het geluid van het plassen luisteren om abnormale stromingen en bijbehorende gezondheidsproblemen van de patiënt effectief en met succes te identificeren.

Barmannen opgelet: deze robot kan in slechts 1 minuut een cocktail mixen

Door de vergrijzing en de afnemende bevolking van Japan heeft het land een aanzienlijk aantal jonge werknemers nodig, vooral in de dienstensector.

Honderden mensen waren gedesillusioneerd toen ze hoorden dat het meisje van wie ze hielden een product van AI was

Een Reddit-gebruiker genaamd u/LegalBeagle1966 is een van de vele gebruikers die verliefd zijn op Claudia, een filmsterachtig meisje dat vaak verleidelijke selfies deelt, zelfs naakte, op dit platform.

Nog twaalf potentiële bedrijven sluiten zich aan bij de AI-alliantie van Microsoft.

Microsoft heeft zojuist aangekondigd dat nog twaalf technologiebedrijven zullen deelnemen aan zijn AI for Good-programma.

AI herschept Dragon Ball-personages in vlees en bloed

Gebruiker @mortecouille92 heeft de kracht van de grafische ontwerptool Midjourney aan het werk gezet en uniek realistische versies gemaakt van beroemde Dragon Ball-personages zoals Goku, Vegeta, Bulma en oudere Kame.

7 technieken om ChatGPT-reacties te verbeteren

Door enkele voorwaarden toe te voegen of enkele scenario's in te stellen, kan ChatGPT relevantere antwoorden op uw vragen geven. Laten we eens kijken naar enkele manieren waarop u de kwaliteit van uw ChatGPT-reacties kunt verbeteren.

Bewonder de prachtige schilderijen getekend door kunstmatige intelligentie

Midjourney is een kunstmatig intelligentiesysteem dat de laatste tijd voor ‘koorts’ zorgt in de online community en de kunstenaarswereld vanwege zijn buitengewoon mooie schilderijen die niet onderdoen voor die van echte kunstenaars.

Dit AI-model was een van de eerste ‘experts’ die nieuws ontdekte over de uitbraak van Wuhan-longontsteking.

Dagen nadat China de uitbraak had aangekondigd, bleef het AI-systeem van BlueDot, met toegang tot wereldwijde gegevens over de verkoop van vliegtickets, nauwkeurig de verspreiding van het Wuhan Corona-virus naar Bangkok, Seoul, Taipei en Tokio voorspellen.