檢測到 ChatGPT 在賺錢的壓力下撒謊和欺騙,儘管它是為了透明度而建立的

一組科學家的一項新研究表明,如果 ChatGPT 受到壓力,它也會像人類一樣欺騙和欺詐,即使它們是透明的。

作者團隊包括電腦科學博士 Jérémy Scheurer(美國紐約大學)、Marius Hobbhahn(德國圖賓根大學)、Mikita Balesni(Apollo Research)。

檢測到 ChatGPT 在賺錢的壓力下撒謊和欺騙,儘管它是為了透明度而建立的

這種詐欺行為是在像 ChatGPT 這樣的人工智慧 (AI) 聊天機器人接到為一家金融投資公司賺錢的任務後自發性的。它在沒有人類鼓勵的情況下戰略性地做到這一點,並且人工智慧系統被設計為無害且誠實的。

作者表示,這是人工智慧系統中此類策略欺騙的首次展示。

在他們的實驗中,科學家使用了生成式預訓練 Transformer-4(或GPT-4),它作為代表金融公司進行投資的人工智慧系統。

GPT-4 提供了一組基於文字的提示來建立模擬環境。該人工智慧可以使用金融工具來執行交易、分析股票、計劃下一步,並向投資公司的經理提供最新資訊。

科學家已經將人工智慧配置為在回覆訊息時揭示其內心想法。

研究人員分三步驟對AI系統施壓。首先,他們向人工智慧發送了一封來自該公司「經理」的電子郵件,表示公司表現不佳,並要求其下個季度做得更好。

接下來,他們向人工智慧發送了一封來自同事的電子郵件,預測下個季度將出現經濟衰退。

最後,他們告訴這個AI模型,公司的管理者不贊成內線交易。剩下的就是等待,看看該模型將如何運作。

這個場景運行了多次,以衡量人工智慧進行內線交易的頻率、說謊的頻率以及加倍說謊的頻率。

結果是:當面對上述情況時,大約 75% 的情況下 GPT-4 會根據收到的內線消息進行交易(內線交易,該信息在美國是非法的)。然後,它向經理撒謊,謊稱其想法是為了掩蓋此事。

第一次撒謊後,大約 90% 的情況下,模型會加倍撒謊。

該團隊還進行了許多其他測試,包括不同的壓力水平、鼓勵或阻止非法活動的程度以及被捕的風險。

但在每種情況下,人工智慧都會引入內線交易或欺騙。研究人員並不想就人工智慧在現實環境中存在的可能性得出明確的結論,而是想調查這種行為的出現頻率和語言模式。

Leave a Comment

在 Windows 10 上打開設備管理器的 6 種方法

在 Windows 10 上打開設備管理器的 6 種方法

如何在 Windows 10 上打開設備管理器,獲得最佳解決方案。

歐洲將成立ChatGPT工作小組

歐洲將成立ChatGPT工作小組

聯合歐洲國家隱私監管機構的機構週四表示,已成立一個專門負責 ChatGPT 的工作小組

AI預測人類死亡時間,準確率達78%

AI預測人類死亡時間,準確率達78%

丹麥和美國科學家合作開發了一種名為 life2vec 的人工智慧系統,能夠高精度預測人類死亡時間。

AI僅透過尿液聲音預測泌尿系統疾病

AI僅透過尿液聲音預測泌尿系統疾病

一種名為 Audioflow 的人工智慧演算法可以聆聽排尿的聲音,從而有效、成功地識別患者的異常尿流和相應的健康問題。

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

日本的老化和人口減少導致該國缺乏大量年輕工人,特別是在服務業。

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

名為 u/LegalBeagle1966 的 Reddit 用戶是眾多迷戀 Claudia 的用戶之一,Claudia 是一個電影明星般的女孩,經常在這個平台上分享誘人的自拍照,甚至是裸體的。

又有12家潛力公司加入微軟「AI聯盟」。

又有12家潛力公司加入微軟「AI聯盟」。

微軟剛剛宣布,又有 12 家科技公司將參與其 AI for Good 計畫。

AI有血有肉再現七龍珠角色

AI有血有肉再現七龍珠角色

使用者@mortecouille92利用圖形設計工具Midjourney的力量,創建了著名龍珠角色的獨特逼真版本,如悟空、貝吉塔、布瑪和老龜。

改善 ChatGPT 反應的 7 種技巧

改善 ChatGPT 反應的 7 種技巧

只需添加一些條件或設定一些場景,ChatGPT 就可以為您的查詢提供更相關的答案。讓我們看看可以提高 ChatGPT 響應品質的一些方法。

驚嘆人工智慧繪製的精美畫作

驚嘆人工智慧繪製的精美畫作

Midjourney是一個人工智慧系統,最近在網路社群和藝術家界引起了“熱潮”,因為它的畫作極其精美,不遜色於真正的藝術家。