如何使用您自己的資料建立自訂 ChatGPT

如何使用您自己的資料建立自訂 ChatGPT

ChatGPT在功能強大且易於使用的聊天機器人中提供 GPT 技術,已成為世界上最受歡迎的人工智慧工具。許多人使用 ChatGPT 來提供引人入勝的對話、回答查詢、提出創意建議以及提供編碼和寫作支援。然而,ChatGPT 是有限制的,因為你不能儲存你的資料供個人長期使用,而且知識資料的截止點是 2021 年 9 月。

另一種方法是在 2021 年之前使用 OpenAI 和 LangChain API 為 ChatGPT 提供自訂資料和更新,以建立 ChatGPT 的自訂版本。

第 1 步:安裝並下載預製軟體和腳本

請注意,以下說明適用於 Windows 10 或 Windows 11 電腦。

要向 ChatGPT 提供自訂數據,您需要安裝並從 GitHub 下載最新的 Python3、Git、Microsoft C++ 和 ChatGPT-retrieval 腳本。如果您的電腦上安裝了某些軟體,請確保將它們更新至最新版本,以避免在此過程中出現任何問題。

首先安裝:

Python3 與 Microsoft C++ 安裝說明

安裝 Python3 時,請確保在按一下「立即安裝」之前選取「將 python.exe 新增至 PATH」選項。這很重要,因為它允許您存取電腦上任何資料夾中的 Python。

如何使用您自己的資料建立自訂 ChatGPT

將 Python 新增到路徑

安裝 Microsoft C++ 時,您首先需要安裝 Microsoft Visual Studio Build Tools。安裝完成後,您可以選取「使用 C++ 進行桌面開發」選項,然後按一下「安裝」,並在右側欄上自動選擇所有選用工具。

如何使用您自己的資料建立自訂 ChatGPT

透過建置工具安裝 Microsoft C++

現在您已經安裝了最新版本的Python3、Git和Microsoft C++,您可以下載Python腳本輕鬆查詢自訂本機資料。

若要下載腳本,請按一下「代碼」,然後選擇「下載 ZIP」。這會將 Python 腳本下載到您的預設或選定目錄。

如何使用您自己的資料建立自訂 ChatGPT

在 GitHub 上下載 Python 腳本

下載後,您現在可以設定本機環境。

第二步:設定本地環境

要設定環境,您需要在下載的 chatgpt-retrieval-main 目錄中開啟一個終端。為此,請打開chatgpt-retrieval-main資料夾,右鍵單擊並選擇在終端中開啟

如何使用您自己的資料建立自訂 ChatGPT

在 chatgpt-retrieval-main 目錄中開啟終端

終端機打開後,複製並貼上以下命令:

pip install langchain openai chromadb tiktoken unstructured

此指令使用Python的套件管理器來建立和管理必要的Python虛擬環境。

建立虛擬環境後,您需要提供 OpenAI API 金鑰來存取其服務。首先,您需要從OpenAI API 金鑰網站產生 API 金鑰,方法是按一下「建立新金鑰」,新增金鑰名稱,然後按「建立金鑰」按鈕。

如何使用您自己的資料建立自訂 ChatGPT

產生秘密 API 金鑰

您將獲得一串字元。這是您的 OpenAI API 金鑰。點擊 API 金鑰旁邊的複製圖示進行複製。請注意,此 API 金鑰必須保密。除非您確實想讓他們與您一起使用該金鑰,否則請勿與其他人共用該金鑰。

複製後,返回chatgpt-retrieval-main資料夾並使用記事本開啟常數。現在將佔位符替換為您的 API 金鑰。記得儲存文件!

如何使用您自己的資料建立自訂 ChatGPT

新增 API 金鑰作為環境變數

現在,您已成功設定虛擬環境並將 OpenAI API 金鑰新增為環境變數。現在您可以向 ChatGPT 提供自訂資料。

第 3 步:新增自訂數據

若要新增自訂數據,請將所有自訂文字資料放入 chatgpt-retrieval-main 的資料資料夾中。文字資料的格式可以是PDFTXT或DOC。

如何使用您自己的資料建立自訂 ChatGPT

為 ChatGPT 新增自訂數據

從上面的螢幕截圖中可以看到,該範例添加了一個文字文件,其中包含預製的個人日程、一篇有關 AMD Instinct AI Accelerators 的文章以及一個 PDF 文件。

第四步:透過終端查詢ChatGPT

Python 腳本可讓您從新增至資料目錄和 Internet 的自訂資料中查詢資料。換句話說,您將可以存取常規 ChatGPT 後端以及本地儲存在資料目錄中的所有資料。

若要使用該腳本,請執行 python 腳本 chatgpt.py 並將您的問題或查詢新增為參數。

python chatgpt.py "YOUR QUESTION"

請務必將您的問題用引號引起來。

例如,要檢查您是否已成功提供 ChatGPT 數據,它會詢問與 Personal Sched.txt 檔案相關的個人問題。

如何使用您自己的資料建立自訂 ChatGPT

使用自訂資料測試 ChatGPT

一切正常!這意味著ChatGPT可以讀取之前提供的Personal Sched.txt。現在讓我們看看您是否已成功提供 ChatGPT 由於其知識截止日期而無法得知的資訊。

如何使用您自己的資料建立自訂 ChatGPT

向自訂 ChatGPT 詢問資料範圍之外的主題

正如您所看到的,它準確地描述了 AMD Instinct MI250x,該產品是在 ChatGPT 的知識截止日期 -3 之後發布的。


歐洲將成立ChatGPT工作小組

歐洲將成立ChatGPT工作小組

聯合歐洲國家隱私監管機構的機構週四表示,已成立一個專門負責 ChatGPT 的工作小組

AI預測人類死亡時間,準確率達78%

AI預測人類死亡時間,準確率達78%

丹麥和美國科學家合作開發了一種名為 life2vec 的人工智慧系統,能夠高精度預測人類死亡時間。

AI僅透過尿液聲音預測泌尿系統疾病

AI僅透過尿液聲音預測泌尿系統疾病

一種名為 Audioflow 的人工智慧演算法可以聆聽排尿的聲音,從而有效、成功地識別患者的異常尿流和相應的健康問題。

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

日本的老化和人口減少導致該國缺乏大量年輕工人,特別是在服務業。

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

名為 u/LegalBeagle1966 的 Reddit 用戶是眾多迷戀 Claudia 的用戶之一,Claudia 是一個電影明星般的女孩,經常在這個平台上分享誘人的自拍照,甚至是裸體的。

又有12家潛力公司加入微軟「AI聯盟」。

又有12家潛力公司加入微軟「AI聯盟」。

微軟剛剛宣布,又有 12 家科技公司將參與其 AI for Good 計畫。

AI有血有肉再現七龍珠角色

AI有血有肉再現七龍珠角色

使用者@mortecouille92利用圖形設計工具Midjourney的力量,創建了著名龍珠角色的獨特逼真版本,如悟空、貝吉塔、布瑪和老龜。

改善 ChatGPT 反應的 7 種技巧

改善 ChatGPT 反應的 7 種技巧

只需添加一些條件或設定一些場景,ChatGPT 就可以為您的查詢提供更相關的答案。讓我們看看可以提高 ChatGPT 響應品質的一些方法。

驚嘆人工智慧繪製的精美畫作

驚嘆人工智慧繪製的精美畫作

Midjourney是一個人工智慧系統,最近在網路社群和藝術家界引起了“熱潮”,因為它的畫作極其精美,不遜色於真正的藝術家。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

這個人工智慧模型是最早發現武漢肺炎疫情消息的「專家」之一。

在中國宣布疫情爆發幾天后,透過獲取全球機票銷售數據,BlueDot 的人工智慧系統繼續準確預測武漢冠狀病毒向曼谷、首爾、台北和東京的傳播。