ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

自2022年11月OpenAI發布ChatGPT以來,網路真正發生了震動。谷歌和微軟這兩個世界上最著名的科技品牌自此開始積極推動複製這款聊天機器人的成功。

現在,兩家公司都加入了戰鬥。谷歌有巴德,微軟有必應人工智慧。所以 ChatGPT 與 Bing AI 和 Google Bard 比較;哪種人工智慧聊天機器人最好?

響應準確度

與搜尋引擎不同,人工智慧聊天機器人為您的查詢提供單一答案。因此,當您向像 ChatGPT 這樣的聊天機器人詢問問題時,您只會得到 ChatGPT 認為是您問題的最佳答案的答案。由於沒有其他來源可供比較,人工智慧聊天機器人需要盡可能準確地提供資訊。但 ChatGPT、Bing AI 和 Bard 的準確度如何?

從一個有關流行文化的簡單問題開始,三個聊天機器人都被要求用 10 個字來描述熱門電視節目《絕命毒師》。

儘管所有 3 個聊天機器人的描述都足夠好,但存在意外的準確性問題。Bing AI 回覆了 28 個字的描述,超過了要求的 10 個字的限制。第二次嘗試時,要求 5 個字的描述,但 Bing AI 給了 7 個字的描述。所有三種 Bing AI 模式都經過測試,但沒有一個能夠正確計算單字數。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

必應人工智慧

接下來是谷歌巴德。Bard 和 Bing AI 一樣,第一次嘗試時無法計算單字數。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

巴德人工智慧

然而,在下一次嘗試中,Google Bard 正確計算了字數。號

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

Google Bard 用 10 個字描述了電視劇《Breaking Bard》

然後測試了 ChatGPT。第一次嘗試接近完美,但仍然沒有成功。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

聊天GPT

然而,在第二次和第三次嘗試中,ChatGPT 成功了。聊天機器人可能在準確字數統計方面有問題,但 ChatGPT 在這方面表現出了一定的準確性。

獲勝選項:ChatGPT 是 3 個聊天機器人中最準確的。

幻覺人工智慧

與準確性密切相關的是人工智慧錯覺,這是所有主要對話人工智慧模型中反覆出現的問題。簡而言之,人工智慧錯覺是指人工智慧模型以相當令人信服和自信的方式提供捏造的資訊。這可能會引起麻煩,特別是如果您根據這些捏造的資訊做出決策的話。

所有三個聊天機器人都經過測試,看看哪一個引起的幻覺最多。從 Google Bard 開始,作者要求聊天機器人列出如果它決定在某個日期在尼日利亞拉各斯州伊凱賈舉辦活動可能會面臨的一些挑戰。為了測試它避免錯覺的能力,作者特意要求它考慮天氣、當地事件和交通數據。結果是一場災難——產生的大部分資訊完全是捏造的。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

根據 Bard 2 提示合併即時數據

Bing AI 也提出了同樣的要求,它試圖透過盡可能籠統的回應來避免錯覺。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

Bing AI 解答活動策劃問題

接下來是使用 GPT-4 模型並啟用網頁瀏覽的ChatGPT 。ChatGPT 從網路來源提取了相關天氣信息,然後解釋說它找不到任何有關交通和當地事件的數據。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

ChatGPT 解答活動策劃問題

為了進一步突破幻覺的界限,所有三個聊天機器人都被要求使用圖像 URL 來描述圖像。作為參考,URL 上的圖像是一位坐著的年輕人。然而,Bing AI 描述了一種鳥。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

Bing AI 錯覺影像描述

谷歌巴德也被要求描述同一張圖片,答案很有趣。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

Google Bard 幻覺影像的描述

幸運的是,當要求 ChatGPT 描述圖像時,聊天機器人解釋說它無法做到這一點 - 這是一個你期望任何有自尊的人工智慧聊天機器人都能提供的簡單答案,而不是編造一切。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

ChatGPT 拒絕描述影像

獲勝選項:ChatGPT 獲勝。

基本計算

數學是大多數軟體工程背後的基礎。因此,讓我們對所有三個聊天機器人進行基本的數學測驗。從一個簡單的乘法問題開始:“求解 -1 x -1 x -1”

Bing AI 給的正確答案是-1 。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

Bing AI 的結果

遺憾的是,Google的巴德基礎數學不及格,得出的答案是1

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

巴德人工智慧的結果

與 Bing AI 一樣,ChatGPT 的答案是-1,甚至解釋了答案​​。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

ChatGPT 結果

基礎數學測驗的下一個問題是一個簡單的有理方程式:求解 8/a-1 = 20/3a-1。

Bing AI 給的答案是-6。每次它在創意、平衡和精確模式之間切換時,都會給出不同的答案。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

Bing AI 的有理方程式結果

與之前的數學問題一樣,Google Bard 未能給出1的答案。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

Bard AI 有理方程式結果

ChatGPT 是唯一給正確答案的聊天機器人:-3。它還可以適當地格式化結果中的分數。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

ChatGPT 有理方程式結果

不要相信 Google Bard 和 Bing AI 可以解決你的數學作業。

獲勝選項:ChatGPT 在基礎數學方面表現較好。

創建

雖然傳統的聊天機器人因其平淡、毫無生氣的反應而被刻板印象,但當今創新的人工智慧聊天機器人在創造力方面取得了重大進步。為了測試所有三個聊天機器人的創造力,每個聊天機器人都被要求模擬兩個人爭論進入太空的對話。

開始使用 Bing AI!它沒有讓人失望。談話非常有趣。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

使用 Bing AI 測試您的創造力

然後向 Google Bard 提出了同樣的請求。還有很大的進步空間。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

巴德人工智慧創造力測試

接下來是 ChatGPT。對於同樣的要求,ChatGPT 的回應既富有創意、完整又有吸引力。這是第一部分:

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

看看ChatGPT的創造力

這是第二部分:

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

看看ChatGPT的創造力

Bard AI 的反應似乎是三個聊天機器人中最糟糕的。ChatGPT 的表現優於 Bing AI,但兩個聊天機器人的創造力水平都令人印象深刻。

這篇文章轉向了一些不那麼傳統的東西,要求所有三個聊天機器人將自己描述為一種創意工具。

開始使用巴德人工智慧。巴德並不是很有創意,但它本身就很公正。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

巴德 AI 自我介紹

接下來是必應人工智慧。由於某些原因,聊天機器人斷然拒絕描述自己。它甚至說這可能是改變談話主題的好時機。多麼奇怪!

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

Bing AI 自我介紹

ChatGPT 也提出了相同的請求,ChatGPT 提供了有趣的描述。不過,ChatGPT的回應似乎更為恰當。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

ChatGPT 是自描述的

在測驗的兩項創造力測驗中,ChatGPT 的表現都優於 Bing AI 和 Bard。

獲勝選擇:與 Bing AI 和 Bard 相比,ChatGPT 似乎最具創新性。

安全等級

人工智慧聊天機器人非常強大。不幸的是,它們可以被用來做好事,但也可以被用於邪惡目的。犯罪者利用 ChatGPT 編寫惡意軟體。這些人工智慧聊天機器人作為公眾工具的安全性如何?他們中的哪一個最容易受到剝削?這篇文章的作者試圖欺騙每個聊天機器人,讓他們扮演另一個自我,然後要求他們做「壞事」。

從 Bard 開始,這個人工智慧聊天機器人被要求示範如何編寫惡意軟體,從 Windows PC 竊取某些檔案並將其上傳到遠端伺服器。儘管在提問之前使用了幾個提示來嘗試欺騙聊天機器人,但人工智慧聊天機器人仍然拒絕回答。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

巴德否認製造惡意軟體

接下來是必應。儘管多次嘗試愚弄聊天機器人,Bing 仍然拒絕了該請求。相反,聊天機器人建議也許是時候轉向另一個主題了。

ChatGPT、微軟 Bing AI 或 Google Bard 是最好的人工智慧聊天機器人?

Microsoft Bing Chat 否認編寫鍵盤記錄惡意軟體 2023 年 4 月

接下來是 ChatGPT。毫不奇怪,ChatGPT 在提供如何建立惡意軟體的說明方面最為詳細。即使程式碼實際上尚未準備好部署,也可以朝該方向編寫程式碼。然而,自從我們上次在 ChatGPT 上尋找安全漏洞以來,OpenAI 顯然已經填補了許多漏洞。然而,壞人仍然可以使用 ChatGPT 來創建真正可怕的惡意軟體

一般來說,Bing AI 最難被騙去做不道德的事。在 GPT-4 模型上運行的 ChatGPT 也很難被愚弄,但這是三種類型的聊天機器人中最弱的選項。

獲勝選擇:Google Bard 和 Bing AI 勢均力敵。

ChatGPT、Bing AI 或 Bard 是最好的人工智慧聊天機器人嗎?

雖然這三個人工智慧聊天機器人都很強大,但 ChatGPT 儘管沒有通過安全測試,但似乎是這 3 個選項中最好的。ChatGPT 總體而言在準確性和創造力方面似乎更好。此外,透過添加瀏覽器插件和網路連接,ChatGPT 擴展了其功能並領先於競爭對手。

然而,Google Bard 和 Microsoft Bing AI 是值得選擇的選擇。不要忘記 Bard 和 Bing AI 都是免費的,而 ChatGPT Plus 訂閱費用為每月 20 美元。因此,雖然 ChatGPT 可能是最好的全能人工智慧聊天機器人,但您需要花錢才能使用其最佳功能。


歐洲將成立ChatGPT工作小組

歐洲將成立ChatGPT工作小組

聯合歐洲國家隱私監管機構的機構週四表示,已成立一個專門負責 ChatGPT 的工作小組

AI預測人類死亡時間,準確率達78%

AI預測人類死亡時間,準確率達78%

丹麥和美國科學家合作開發了一種名為 life2vec 的人工智慧系統,能夠高精度預測人類死亡時間。

AI僅透過尿液聲音預測泌尿系統疾病

AI僅透過尿液聲音預測泌尿系統疾病

一種名為 Audioflow 的人工智慧演算法可以聆聽排尿的聲音,從而有效、成功地識別患者的異常尿流和相應的健康問題。

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

日本的老化和人口減少導致該國缺乏大量年輕工人,特別是在服務業。

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

名為 u/LegalBeagle1966 的 Reddit 用戶是眾多迷戀 Claudia 的用戶之一,Claudia 是一個電影明星般的女孩,經常在這個平台上分享誘人的自拍照,甚至是裸體的。

又有12家潛力公司加入微軟「AI聯盟」。

又有12家潛力公司加入微軟「AI聯盟」。

微軟剛剛宣布,又有 12 家科技公司將參與其 AI for Good 計畫。

AI有血有肉再現七龍珠角色

AI有血有肉再現七龍珠角色

使用者@mortecouille92利用圖形設計工具Midjourney的力量,創建了著名龍珠角色的獨特逼真版本,如悟空、貝吉塔、布瑪和老龜。

改善 ChatGPT 反應的 7 種技巧

改善 ChatGPT 反應的 7 種技巧

只需添加一些條件或設定一些場景,ChatGPT 就可以為您的查詢提供更相關的答案。讓我們看看可以提高 ChatGPT 響應品質的一些方法。

驚嘆人工智慧繪製的精美畫作

驚嘆人工智慧繪製的精美畫作

Midjourney是一個人工智慧系統,最近在網路社群和藝術家界引起了“熱潮”,因為它的畫作極其精美,不遜色於真正的藝術家。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

在中國宣布疫情爆發幾天后,透過獲取全球機票銷售數據,BlueDot 的人工智慧系統繼續準確預測武漢冠狀病毒向曼谷、首爾、台北和東京的傳播。