De AI van Microsoft heeft drie seconden nodig om iemands stem te imiteren

Vall-E, een AI gemaakt door Microsoft, kan de toon en spraak van echte mensen nabootsen door drie seconden naar hun stem te luisteren, hoewel deze nog steeds een beetje als een robotstem zal klinken.

Microsoft's AI Vall-E. Illustratiefoto: VallE-Demo.

Dit AI-systeem van Microsoft heet "Neural codec Language Model". Een codec is een tool die algoritmen gebruikt om video te verwerken en op te slaan in een stroom van bytes. Audio- of videobestanden worden verkleind en vervolgens voor verschillende doeleinden gedecomprimeerd.

Vall-E is door Microsoft gebouwd op het EnCodec-platform, een audiocodec die gebruik maakt van machine learning-technieken die in 2022 door Meta zijn ontwikkeld. Vall-E creëert unieke audiocodecs door de audio van elke persoon vast te leggen en te analyseren. Vervolgens wordt de informatie via EnCodec opgesplitst in delen die "tokens" worden genoemd. Dit verschilt van eerdere tekst-naar-spraak-methoden, die meestal in golfvorm zijn.

Vall-E gebruikt vervolgens de trainingsgegevens om te matchen met wat het "weet" over spraakintonatie, zodat het andere zinnen kan zeggen op basis van wat het "geleerd" heeft.

Dit hele proces van spraakimitatie wordt in drie seconden uitgevoerd – nog nooit eerder bereikt door welk AI-systeem voor taalimitatie dan ook.

Microsoft gebruikt een bibliotheek met 60.000 uur Engelstalige lessen van meer dan 7.000 mensen om Vall-E te trainen. Deze bibliotheek zal in de loop van de tijd en in meer talen worden toegevoegd.

Microsoft hoopt dat Vall-E wordt toegepast in hoogwaardige tekst-naar-spraaksoftware.

Vall-E maakt experts echter bang dat het voor kwaadaardige doeleinden kan worden gebruikt. Deze AI kan door slechteriken worden gebruikt om stemmen na te bootsen met het oog op fraude en afpersing. Als deze AI wordt gecombineerd met deepfake-video’s, kan het gevaar zich vele malen vermenigvuldigen.

Laat een reactie achter

De ChatGPT-taskforce zal door Europa worden opgericht

Het orgaan dat de nationale privacywaakhonden van Europa verenigt, zei donderdag dat het een taskforce heeft opgericht die zich specifiek bezighoudt met ChatGPT

AI voorspelt het tijdstip van de menselijke dood met een nauwkeurigheid van 78%

Deense en Amerikaanse wetenschappers hebben samengewerkt om een AI-systeem te ontwikkelen genaamd life2vec, dat in staat is om het tijdstip van menselijke dood met hoge nauwkeurigheid te voorspellen.

AI voorspelt urinewegaandoeningen alleen al op basis van het geluid van urine

Een AI-algoritme genaamd Audioflow kan naar het geluid van het plassen luisteren om abnormale stromingen en bijbehorende gezondheidsproblemen van de patiënt effectief en met succes te identificeren.

Barmannen opgelet: deze robot kan in slechts 1 minuut een cocktail mixen

Door de vergrijzing en de afnemende bevolking van Japan heeft het land een aanzienlijk aantal jonge werknemers nodig, vooral in de dienstensector.

Honderden mensen waren gedesillusioneerd toen ze hoorden dat het meisje van wie ze hielden een product van AI was

Een Reddit-gebruiker genaamd u/LegalBeagle1966 is een van de vele gebruikers die verliefd zijn op Claudia, een filmsterachtig meisje dat vaak verleidelijke selfies deelt, zelfs naakte, op dit platform.

Nog twaalf potentiële bedrijven sluiten zich aan bij de AI-alliantie van Microsoft.

Microsoft heeft zojuist aangekondigd dat nog twaalf technologiebedrijven zullen deelnemen aan zijn AI for Good-programma.

AI herschept Dragon Ball-personages in vlees en bloed

Gebruiker @mortecouille92 heeft de kracht van de grafische ontwerptool Midjourney aan het werk gezet en uniek realistische versies gemaakt van beroemde Dragon Ball-personages zoals Goku, Vegeta, Bulma en oudere Kame.

7 technieken om ChatGPT-reacties te verbeteren

Door enkele voorwaarden toe te voegen of enkele scenario's in te stellen, kan ChatGPT relevantere antwoorden op uw vragen geven. Laten we eens kijken naar enkele manieren waarop u de kwaliteit van uw ChatGPT-reacties kunt verbeteren.

Bewonder de prachtige schilderijen getekend door kunstmatige intelligentie

Midjourney is een kunstmatig intelligentiesysteem dat de laatste tijd voor ‘koorts’ zorgt in de online community en de kunstenaarswereld vanwege zijn buitengewoon mooie schilderijen die niet onderdoen voor die van echte kunstenaars.

Dit AI-model was een van de eerste ‘experts’ die nieuws ontdekte over de uitbraak van Wuhan-longontsteking.

Dagen nadat China de uitbraak had aangekondigd, bleef het AI-systeem van BlueDot, met toegang tot wereldwijde gegevens over de verkoop van vliegtickets, nauwkeurig de verspreiding van het Wuhan Corona-virus naar Bangkok, Seoul, Taipei en Tokio voorspellen.