Die KI von Microsoft benötigt drei Sekunden, um die Stimme eines anderen Menschen zu imitieren

Vall-E, eine von Microsoft entwickelte KI, kann den Ton und die Sprache echter Menschen nachahmen, indem sie drei Sekunden lang auf ihre Stimme hört, obwohl sie immer noch ein wenig wie eine Roboterstimme klingt.

Microsofts KI Vall-E. Illustrationsfoto: VallE-Demo.

Dieses KI-System von Microsoft nennt sich „Neural Codec Language Model“. Ein Codec ist ein Tool, das Algorithmen verwendet, um Videos zu verarbeiten und in einem Bytestrom zu speichern. Audio- oder Videodateien werden minimiert und dann für verschiedene Zwecke dekomprimiert.

Vall-E wurde von Microsoft auf der EnCodec-Plattform erstellt, einem Audio-Codec, der maschinelle Lerntechniken nutzt und 2022 von Meta entwickelt wurde. Vall-E erstellt einzigartige Audio-Codecs, indem es die Audiodaten jeder Person erfasst und analysiert. Anschließend werden die Informationen über EnCodec in Teile, sogenannte „Tokens“, zerlegt. Dies unterscheidet sich von früheren Text-to-Speech-Methoden, die normalerweise in Wellenform vorliegen.

Vall-E verwendet dann die Trainingsdaten, um das abzugleichen, was es über die Sprachintonation „weiß“, sodass es je nach dem, was es „gelernt“ hat, andere Phrasen sagen kann.

Dieser gesamte Sprachimitationsprozess ist in drei Sekunden erledigt – was noch nie zuvor von einem KI-System zur Sprachimitation erreicht wurde.

Microsoft nutzt eine Bibliothek mit 60.000 Stunden Englischunterricht von mehr als 7.000 Personen, um Vall-E zu trainieren. Diese Bibliothek wird im Laufe der Zeit und in weiteren Sprachen erweitert.

Microsoft hofft, dass Vall-E in hochwertiger Text-to-Speech-Software zum Einsatz kommt.

Vall-E gibt Experten jedoch Anlass zur Sorge, dass es für böswillige Zwecke genutzt werden könnte. Diese KI kann von Bösewichten genutzt werden, um Stimmen zum Zwecke des Betrugs und der Erpressung nachzuahmen. Kombiniert man diese KI mit Deepfake-Videos, kann sich das Gefahrenniveau um ein Vielfaches vervielfachen.

Einen Kommentar hinterlassen

Die ChatGPT-Task Force wird von Europa eingerichtet

Das Gremium, das die nationalen Datenschutzbeauftragten Europas vereint, gab am Donnerstag bekannt, dass es eine Task Force für ChatGPT eingerichtet habe

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

Dänische und amerikanische Wissenschaftler haben gemeinsam ein KI-System namens life2vec entwickelt, das den Zeitpunkt des menschlichen Todes mit hoher Genauigkeit vorhersagen kann.

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

Ein KI-Algorithmus namens Audioflow kann auf das Geräusch des Urinierens hören, um abnormale Urinflüsse und entsprechende Gesundheitsprobleme des Patienten effektiv und erfolgreich zu identifizieren.

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Japans alternde und schrumpfende Bevölkerung hat dazu geführt, dass dem Land eine erhebliche Zahl junger Arbeitskräfte fehlt, insbesondere im Dienstleistungssektor.

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Ein Reddit-Benutzer namens u/LegalBeagle1966 ist einer von vielen Benutzern, die in Claudia verliebt sind, ein Mädchen wie ein Filmstar, das auf dieser Plattform oft verführerische Selfies, sogar nackte, teilt.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

Microsoft hat gerade angekündigt, dass zwölf weitere Technologieunternehmen an seinem AI for Good-Programm teilnehmen werden.

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Benutzer @mortecouille92 hat die Leistungsfähigkeit des Grafikdesign-Tools Midjourney genutzt und einzigartig realistische Versionen berühmter Dragon Ball-Charaktere wie Goku, Vegeta, Bulma und Elder Kame erstellt. .

7 Techniken zur Verbesserung von ChatGPT-Antworten

Durch einfaches Hinzufügen einiger Bedingungen oder Einrichten einiger Szenarien kann ChatGPT relevantere Antworten auf Ihre Fragen geben. Schauen wir uns einige Möglichkeiten an, wie Sie die Qualität Ihrer ChatGPT-Antworten verbessern können.

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Midjourney ist ein künstliches Intelligenzsystem, das aufgrund seiner äußerst schönen Gemälde, die denen echter Künstler in nichts nachstehen, in letzter Zeit in der Online-Community und der Künstlerwelt für „Fieber“ gesorgt hat.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Tage nachdem China den Ausbruch bekannt gegeben hatte, konnte das KI-System von BlueDot mit Zugriff auf weltweite Flugscheinverkaufsdaten die Ausbreitung des Wuhan-Corona-Virus nach Bangkok, Seoul, Taipeh und Tokio weiterhin genau vorhersagen.