微軟的人工智慧只需三秒鐘就能模仿任何人的聲音

微軟的人工智慧只需三秒鐘就能模仿任何人的聲音

微軟創建的人工智慧Vall-E可以透過聽真人的聲音三秒鐘來模仿真人的語氣和言語,儘管聽起來仍然有點像機器人的聲音。

微軟的人工智慧只需三秒鐘就能模仿任何人的聲音

微軟的AI Val-E。圖解照片:ValE-Demo。

微軟的這個人工智慧系統被稱為「神經編解碼語言模型」。編解碼器是一種使用演算法處理視訊並將其儲存在位元組流中的工具。音訊或視訊檔案被縮小,然後解壓縮以用於各種目的。

Vall-E 由 Microsoft 在 EnCodec 平台上構建,EnCodec 平台是 Meta 於 2022 年開發的使用機器學習技術的音訊編解碼器。Vall-E 透過捕捉和分析每個人的音訊來創建獨特的音訊編解碼器,然後透過 EnCodec 將資訊分解為稱為「令牌」的部分。這與先前的文字轉語音方法不同,後者通常採用波形形式。

然後,Vall-E 使用訓練資料來匹配它「知道」的語音語調,這樣它就可以根據它「學到」的內容說出其他短語。

整個語音模仿過程只需三秒鐘即可完成——這是當今任何語言模仿人工智慧系統都從未實現過的。

Microsoft 使用包含 7,000 多人的 60,000 小時英語口語的程式庫來培訓 Vall-E。隨著時間的推移,該庫將被添加到更多語言中。

微軟希望Vall-E能夠應用於高品質的文字轉語音軟體。

然而,Vall-E 讓專家擔心它可能被用於惡意目的。壞人可以利用這種人工智慧來冒充聲音,以達到欺詐和勒索的目的。如果這種人工智慧與深度偽造影片結合起來,危險程度可能會倍增。


歐洲將成立ChatGPT工作小組

歐洲將成立ChatGPT工作小組

聯合歐洲國家隱私監管機構的機構週四表示,已成立一個專門負責 ChatGPT 的工作小組

AI預測人類死亡時間,準確率達78%

AI預測人類死亡時間,準確率達78%

丹麥和美國科學家合作開發了一種名為 life2vec 的人工智慧系統,能夠高精度預測人類死亡時間。

AI僅透過尿液聲音預測泌尿系統疾病

AI僅透過尿液聲音預測泌尿系統疾病

一種名為 Audioflow 的人工智慧演算法可以聆聽排尿的聲音,從而有效、成功地識別患者的異常尿流和相應的健康問題。

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

日本的老化和人口減少導致該國缺乏大量年輕工人,特別是在服務業。

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

名為 u/LegalBeagle1966 的 Reddit 用戶是眾多迷戀 Claudia 的用戶之一,Claudia 是一個電影明星般的女孩,經常在這個平台上分享誘人的自拍照,甚至是裸體的。

又有12家潛力公司加入微軟「AI聯盟」。

又有12家潛力公司加入微軟「AI聯盟」。

微軟剛剛宣布,又有 12 家科技公司將參與其 AI for Good 計畫。

AI有血有肉再現七龍珠角色

AI有血有肉再現七龍珠角色

使用者@mortecouille92利用圖形設計工具Midjourney的力量,創建了著名龍珠角色的獨特逼真版本,如悟空、貝吉塔、布瑪和老龜。

改善 ChatGPT 反應的 7 種技巧

改善 ChatGPT 反應的 7 種技巧

只需添加一些條件或設定一些場景,ChatGPT 就可以為您的查詢提供更相關的答案。讓我們看看可以提高 ChatGPT 響應品質的一些方法。

驚嘆人工智慧繪製的精美畫作

驚嘆人工智慧繪製的精美畫作

Midjourney是一個人工智慧系統,最近在網路社群和藝術家界引起了“熱潮”,因為它的畫作極其精美,不遜色於真正的藝術家。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

在中國宣布疫情爆發幾天后,透過獲取全球機票銷售數據,BlueDot 的人工智慧系統繼續準確預測武漢冠狀病毒向曼谷、首爾、台北和東京的傳播。