Sztuczna inteligencja Microsoftu potrzebuje trzech sekund, aby naśladować czyjś głos

Vall-E, sztuczna inteligencja stworzona przez Microsoft, może naśladować ton i mowę prawdziwych ludzi, słuchając ich głosu przez trzy sekundy, chociaż nadal będzie on brzmiał trochę jak głos robota.

Sztuczna inteligencja Vall-E firmy Microsoft. Zdjęcie ilustracyjne: VallE-Demo.

Ten system sztucznej inteligencji firmy Microsoft nazywany jest „modelem języka kodeka neuronowego”. Kodek to narzędzie wykorzystujące algorytmy do przetwarzania wideo i przechowywania go w strumieniu bajtów. Pliki audio lub wideo są minimalizowane, a następnie dekompresowane w różnych celach.

Vall-E został zbudowany przez firmę Microsoft na platformie EnCodec, kodeku audio wykorzystującym techniki uczenia maszynowego opracowane w 2022 roku przez firmę Meta. Vall-E tworzy unikalne kodeki audio, przechwytując i analizując dźwięk każdej osoby, a następnie informacje są dzielone na części zwane „tokenami” za pomocą EnCodec. Różni się to od poprzednich metod zamiany tekstu na mowę, które zwykle mają formę falową.

Następnie Vall-E wykorzystuje dane szkoleniowe, aby dopasować swoją „wiedzę” o intonacji mowy, dzięki czemu może wypowiadać inne frazy zgodnie z tym, czego się „nauczył”.

Cały proces imitacji mowy trwa trzy sekundy – nigdy wcześniej nie udało się tego osiągnąć żadnemu współczesnemu systemowi sztucznej inteligencji imitującej język.

Do szkolenia Vall-E Microsoft korzysta z biblioteki zawierającej 60 000 godzin rozmów po angielsku od ponad 7 000 osób. Ta biblioteka będzie z czasem dodawana w większej liczbie języków.

Microsoft ma nadzieję, że Vall-E zostanie zastosowany w wysokiej jakości oprogramowaniu do zamiany tekstu na mowę.

Jednak Vall-E budzi wśród ekspertów obawy, że może on zostać wykorzystany do szkodliwych celów. Ta sztuczna inteligencja może być wykorzystywana przez złoczyńców do podszywania się pod głosy w celu oszustwa i wymuszenia. Jeśli tę sztuczną inteligencję połączymy z filmami typu deepfake, poziom zagrożenia może wielokrotnie wzrosnąć.

Zostaw komentarz

Europa utworzy grupę zadaniową ChatGPT

Organ zrzeszający krajowe organy nadzorujące prywatność w Europie poinformował w czwartek, że powołał grupę zadaniową zajmującą się ChatGPT

AI przewiduje czas śmierci człowieka z 78% dokładnością

Duńscy i amerykańscy naukowcy współpracowali nad opracowaniem systemu sztucznej inteligencji o nazwie life2vec, zdolnego do przewidywania czasu śmierci człowieka z dużą dokładnością.

Sztuczna inteligencja przewiduje choroby układu moczowego na podstawie dźwięku moczu

Algorytm sztucznej inteligencji o nazwie Audioflow może nasłuchiwać dźwięku oddawania moczu, aby skutecznie i skutecznie identyfikować nieprawidłowe wypływy moczu i powiązane z nimi problemy zdrowotne pacjenta.

Barmani, uważajcie: ten robot może przygotować koktajl w zaledwie 1 minutę

Starzenie się i spadek liczby ludności Japonii spowodował, że w kraju brakuje znacznej liczby młodych pracowników, szczególnie w sektorze usług.

Setki ludzi rozczarowało się, gdy dowiedziały się, że dziewczyna, którą kochają, jest wytworem sztucznej inteligencji

Użytkownik Reddita o imieniu u/LegalBeagle1966 jest jednym z wielu użytkowników zakochanych w Claudii, dziewczynie przypominającej gwiazdę filmową, która często udostępnia na tej platformie uwodzicielskie selfie, nawet nagie.

12 kolejnych potencjalnych firm dołącza do „sojuszu AI” Microsoftu.

Microsoft właśnie ogłosił, że w jego programie AI for Good weźmie udział 12 kolejnych firm technologicznych.

Sztuczna inteligencja odtwarza postacie Dragon Ball z krwi i kości

Użytkownik @mortecouille92 wykorzystał moc narzędzia do projektowania graficznego Midjourney i stworzył wyjątkowo realistyczne wersje słynnych postaci Dragon Ball, takich jak Goku, Vegeta, Bulma i starszy Kame. .

7 technik poprawy odpowiedzi ChatGPT

Po prostu dodając pewne warunki lub konfigurując pewne scenariusze, ChatGPT może udzielić bardziej trafnych odpowiedzi na Twoje zapytania. Przyjrzyjmy się sposobom poprawy jakości odpowiedzi ChatGPT.

Podziwiaj piękne obrazy narysowane przez sztuczną inteligencję

Midjourney to system sztucznej inteligencji, który wywołał ostatnio „gorączkę” w społeczności internetowej i świecie artystów ze względu na niezwykle piękne obrazy, które nie ustępują tym, które tworzą prawdziwi artyści.

Ten model sztucznej inteligencji był jednym z pierwszych „ekspertów”, którzy odkryli wiadomości o wybuchu zapalenia płuc w Wuhan.

Kilka dni po ogłoszeniu przez Chiny wybuchu epidemii, mając dostęp do danych dotyczących globalnej sprzedaży biletów lotniczych, system sztucznej inteligencji BlueDot w dalszym ciągu dokładnie przewidywał rozprzestrzenianie się wirusa korona z Wuhan do Bangkoku, Seulu, Tajpej i Tokio.