成功發展出可以將語言轉化為肢體動作的AI模型

成功發展出可以將語言轉化為肢體動作的AI模型

美國賓州卡內基美隆大學的人工智慧研究人員最近成功開發了一種深度人工智慧模型,能夠以相對較高的精確度將語言(文字、語音)翻譯成動作和手勢。

這種人工智慧模型被命名為聯合語言到姿勢(JL2P),被認為是一種提供將自然語言與有效的3D姿勢模擬模型相結合的能力的方法,在不久的將來會得到實際應用。

成功發展出可以將語言轉化為肢體動作的AI模型這個人工智慧模型被命名為聯合語言到姿勢(JL2P)。

JL2P 在 3D 空間中分析和模擬姿勢和手勢的能力是透過端到端程式進行徹底訓練的,這是一種強大而有效的程式設計方法。訓練程式被「分解」為單獨的序列。人工智慧模型必須先完成簡短的任務,然後才能繼續實現更複雜的目標。

目前,JL2P的動畫模擬能力僅限於基本影像(由簡單的直線組成),但模擬人類動作的能力是基於模型的語言,這種AI視覺化相對準確且直觀。團隊相信,像 JL2P 這樣的模型有一天可以幫助機器人執行類似於人類的現實世界物理任務,或幫助創建視頻遊戲和電影的虛擬動畫角色。

成功發展出可以將語言轉化為肢體動作的AI模型JL2P的動畫模擬功能僅限於基本的、簡單的圖像

實際上,開發能夠將語言轉化為身體動作的人工智慧模型的想法並不新鮮。在卡內基美隆大學推出 JL2P 之前,微軟也成功開發了一個名為 ObjGAN 的模型,其任務是根據語言註釋繪製圖像和故事板(以圖像形式勾勒出你想要講述的故事的板)。迪士尼的另一個人工智慧模型也因其使用劇本中的單字創建故事板的能力而廣為人知。或者最著名的是Nvidia 的 GauGAN 模型,它可以將用觸控板或 Microsoft Paint 創建的塗鴉變成具有極高美感的智慧數位草圖。

回到 JL2P,這個 AI 模型現在可以非常準確地模擬一系列從簡單到相對複雜的動作,例如行走或跑步、演奏樂器(如吉他或小提琴)、遵循預定指示、方向(左或右)或速度控制(快或慢)。

  • 成功開發出由AI驅動的觸控螢幕和VR“想像鍵盤”

成功發展出可以將語言轉化為肢體動作的AI模型JL2P 現在可以非常準確地模擬從簡單到相對複雜的多種運動

「我們首先優化了模型,以根據完整的句子預測兩個時間步驟。這個簡單的任務可以幫助AI模型學習模擬非常短的姿勢序列,例如行走時的腿部運動、揮手時的手部運動,或是鞠躬時的身體姿勢和姿勢。一旦 JL2P 學會如何高精度地模擬相同的手勢,我們就會進入課程的下一階段。該模型現在同時給出兩個(多個)姿勢進行預測,」卡內基美隆大學研究團隊表示。

成功發展出可以將語言轉化為肢體動作的AI模型模擬正常人的跑步姿勢

JL2P的運作模式細節以及典型的「作品」首次在arXiv.org網站7月2日發表的科學論文中被提出,預計將由作者和研究人員小組提出。9 月19 日,CMU Chaitanya Ahuja 語言技術學院在加拿大魁北克舉行的國際3D 視覺會議的舞台上。

研究團隊自信地斷言,JL2P 模擬姿勢和身體運動的準確度比 SRI International 人工智慧專家在 2018 年開發的另一個「一流」人工智慧模型高出 9%。

成功發展出可以將語言轉化為肢體動作的AI模型JL2P模擬人類單手站立的動作

JL2P使用KIT運動語言資料集(KIT Motion-Language Dataset)進行訓練後創建的產品。

成功發展出可以將語言轉化為肢體動作的AI模型JL2P模擬跳過障礙物和奔跑的動作

這項挖掘資料集由德國Performance Humanoid Technologies 公司於2016 年首次推出,它是人類運動與自然語言描述的結合,一次映射一個人11 小時的連續運動,記錄成6,200 多個英語句子,每個句子約8個單字長的。


歐洲將成立ChatGPT工作小組

歐洲將成立ChatGPT工作小組

聯合歐洲國家隱私監管機構的機構週四表示,已成立一個專門負責 ChatGPT 的工作小組

AI預測人類死亡時間,準確率達78%

AI預測人類死亡時間,準確率達78%

丹麥和美國科學家合作開發了一種名為 life2vec 的人工智慧系統,能夠高精度預測人類死亡時間。

AI僅透過尿液聲音預測泌尿系統疾病

AI僅透過尿液聲音預測泌尿系統疾病

一種名為 Audioflow 的人工智慧演算法可以聆聽排尿的聲音,從而有效、成功地識別患者的異常尿流和相應的健康問題。

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

日本的老化和人口減少導致該國缺乏大量年輕工人,特別是在服務業。

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

名為 u/LegalBeagle1966 的 Reddit 用戶是眾多迷戀 Claudia 的用戶之一,Claudia 是一個電影明星般的女孩,經常在這個平台上分享誘人的自拍照,甚至是裸體的。

又有12家潛力公司加入微軟「AI聯盟」。

又有12家潛力公司加入微軟「AI聯盟」。

微軟剛剛宣布,又有 12 家科技公司將參與其 AI for Good 計畫。

AI有血有肉再現七龍珠角色

AI有血有肉再現七龍珠角色

使用者@mortecouille92利用圖形設計工具Midjourney的力量,創建了著名龍珠角色的獨特逼真版本,如悟空、貝吉塔、布瑪和老龜。

改善 ChatGPT 反應的 7 種技巧

改善 ChatGPT 反應的 7 種技巧

只需添加一些條件或設定一些場景,ChatGPT 就可以為您的查詢提供更相關的答案。讓我們看看可以提高 ChatGPT 響應品質的一些方法。

驚嘆人工智慧繪製的精美畫作

驚嘆人工智慧繪製的精美畫作

Midjourney是一個人工智慧系統,最近在網路社群和藝術家界引起了“熱潮”,因為它的畫作極其精美,不遜色於真正的藝術家。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

在中國宣布疫情爆發幾天后,透過獲取全球機票銷售數據,BlueDot 的人工智慧系統繼續準確預測武漢冠狀病毒向曼谷、首爾、台北和東京的傳播。