亞馬遜的人工智慧系統有助於將 Alexa 的語音辨識錯誤減少 15%。

亞馬遜的人工智慧系統有助於將 Alexa 的語音辨識錯誤減少 15%。

幾個月前,亞馬遜詳細說明了一些問題,這些問題導致當用戶在某些電視型號、網路或廣播廣告中喚醒虛擬助理時,Alexa 無法提供準確的回應。畢竟,這裡的主要問題是亞馬遜的語音助理如何有效過濾環境中的背景噪音,為用戶提供更準確的回饋。最近,在一篇名為「端對端錨定語音辨識」的部落格文章和隨附的研究論文中,亞馬遜工程師特別提出了一種基於人工智慧創建的新噪音隔離技術,可以幫助將Alexa 的語音識別和命令提高15%。有關該系統如何運作的更多詳細資訊預計將在今年稍後在布萊頓舉行的國際聲學、語音和訊號處理會議上公佈。

亞馬遜的人工智慧系統有助於將 Alexa 的語音辨識錯誤減少 15%。

「事實上,我們一直試圖透過教她如何『忽略』不適合她的命令來提高 Alexa 的性能,換句話說,知道如何在周圍環境發出的無數噪音中選擇命令。為此,我們假設揚聲器透過說出一些特定的喚醒詞(通常是「Alexa」)來啟動支援 Alexa 的設備,而這是虛擬助理必須在混亂的外部聲音中隔離和識別的關鍵短語環境。基本上,我們的技術將有助於快速「捕獲」可能是喚醒詞的聲音(通常基於語調或音素的​​相似性)並將其與喚醒詞進行比較。準確識別句子的標準。然後,元素與標準喚醒詞最匹配的句子將被 Alexa 理解為命令,而其他句子將被視為背景噪音。」負責該計畫的科學家團隊負責人 Xin Fan 說。人工智慧解釋道。

Xin Fan 和同事沒有訓練單獨的人工智慧系統來區分背景噪音和喚醒詞,而是將他們的單字匹配機制與基於智慧的語音辨識模型結合。科學家按順序測試了解碼器人工智慧架構的兩種變體,即使用處理輸入資料(音訊訊號的毫秒長快照)的架構來產生相應的輸出序列(聲音的音素渲染),以及與大多數傳統的編碼器-解碼技術一樣,編碼元件將輸入資料匯總為固定長度的向量(一串數字)並將其轉換為輸出資料。同時,一種特殊的注意力機制,「訓練」來偵測周圍環境中一個或多個語音串中喚醒詞的一些基本特徵,將負責「引導」該集合,解碼更關注向量中的這些特徵。

亞馬遜的人工智慧系統有助於將 Alexa 的語音辨識錯誤減少 15%。

在一項實驗中,研究人員訓練他們的一個人工智慧模型,使其更加重視單字發音識別,首先添加一個組件,直接將單字的聲音與各種發音進行比較,然後使用所得數據作為另一個單獨的輸入已被訓練來壓縮編碼向量位的組件。結果很有趣,該模型將錯誤率從 15% 降低到了 13%。


歐洲將成立ChatGPT工作小組

歐洲將成立ChatGPT工作小組

聯合歐洲國家隱私監管機構的機構週四表示,已成立一個專門負責 ChatGPT 的工作小組

AI預測人類死亡時間,準確率達78%

AI預測人類死亡時間,準確率達78%

丹麥和美國科學家合作開發了一種名為 life2vec 的人工智慧系統,能夠高精度預測人類死亡時間。

AI僅透過尿液聲音預測泌尿系統疾病

AI僅透過尿液聲音預測泌尿系統疾病

一種名為 Audioflow 的人工智慧演算法可以聆聽排尿的聲音,從而有效、成功地識別患者的異常尿流和相應的健康問題。

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

日本的老化和人口減少導致該國缺乏大量年輕工人,特別是在服務業。

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

名為 u/LegalBeagle1966 的 Reddit 用戶是眾多迷戀 Claudia 的用戶之一,Claudia 是一個電影明星般的女孩,經常在這個平台上分享誘人的自拍照,甚至是裸體的。

又有12家潛力公司加入微軟「AI聯盟」。

又有12家潛力公司加入微軟「AI聯盟」。

微軟剛剛宣布,又有 12 家科技公司將參與其 AI for Good 計畫。

AI有血有肉再現七龍珠角色

AI有血有肉再現七龍珠角色

使用者@mortecouille92利用圖形設計工具Midjourney的力量,創建了著名龍珠角色的獨特逼真版本,如悟空、貝吉塔、布瑪和老龜。

改善 ChatGPT 反應的 7 種技巧

改善 ChatGPT 反應的 7 種技巧

只需添加一些條件或設定一些場景,ChatGPT 就可以為您的查詢提供更相關的答案。讓我們看看可以提高 ChatGPT 響應品質的一些方法。

驚嘆人工智慧繪製的精美畫作

驚嘆人工智慧繪製的精美畫作

Midjourney是一個人工智慧系統,最近在網路社群和藝術家界引起了“熱潮”,因為它的畫作極其精美,不遜色於真正的藝術家。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

在中國宣布疫情爆發幾天后,透過獲取全球機票銷售數據,BlueDot 的人工智慧系統繼續準確預測武漢冠狀病毒向曼谷、首爾、台北和東京的傳播。