独自のデータを使用してカスタム ChatGPT を構築する方法

独自のデータを使用してカスタム ChatGPT を構築する方法

GPT テクノロジーを強力で使いやすいチャットボットとして提供するChatGPT は、世界で最も人気のある AI ツールになりました。多くの人が ChatGPT を使用して、魅力的な会話を提供したり、質問に答えたり、創造的な提案をしたり、コーディングや執筆のサポートを提供したりしています。ただし、ChatGPT には個人的な長期使用のためにデータを保存することができないため制限があり、ナレッジ データのカットオフ ポイントは 2021 年 9 月です。

別の方法は、OpenAI および LangChain API を使用して、2021 年までに ChatGPT にカスタム データと更新を提供し、ChatGPT のカスタム バージョンを作成することです。

ステップ 1: 既製のソフトウェアとスクリプトをインストールしてダウンロードする

次の手順は Windows 10 または Windows 11 マシンを対象としていることに注意してください。

ChatGPT にカスタム データを提供するには、最新の Python3、Git、Microsoft C++、および GitHub から ChatGPT 取得スクリプトをインストールしてダウンロードする必要があります。PC に何らかのソフトウェアがインストールされている場合は、プロセス中に問題が発生しないように、それらが最新バージョンに更新されていることを確認してください。

まずは以下をインストールしてください。

Python3 および Microsoft C++ のインストールに関するメモ

Python3 をインストールするときは、「今すぐインストール」をクリックする前に、「Python.exe を PATH に追加」オプションを必ずチェックしてください。これにより、コンピュータ上の任意のフォルダにある Python にアクセスできるようになるため、これは重要です。

独自のデータを使用してカスタム ChatGPT を構築する方法

PythonをPATHに追加

Microsoft C++ をインストールするときは、まず Microsoft Visual Studio Build Tools をインストールします。インストールしたら、 [C++ によるデスクトップ開発]オプションをチェックし、右側のサイドバーですべてのオプション ツールが自動的に選択された状態で[インストール]をクリックします。

独自のデータを使用してカスタム ChatGPT を構築する方法

ビルドツールを使用して Microsoft C++ をインストールする

最新バージョンの Python3、Git、Microsoft C++ がインストールされたので、Python スクリプトをダウンロードしてカスタム ローカル データを簡単にクエリできます。

スクリプトをダウンロードするには、「コード」をクリックし、「ZIP のダウンロード」を選択します。これにより、Python スクリプトがデフォルトまたは選択したディレクトリにダウンロードされます。

独自のデータを使用してカスタム ChatGPT を構築する方法

GitHub で Python スクリプトをダウンロードする

ダウンロードしたら、ローカル環境をセットアップできるようになります。

ステップ 2: ローカル環境をセットアップする

環境をセットアップするには、ダウンロードした chatgpt-retrieval-main ディレクトリでターミナルを開く必要があります。これを行うには、chatgpt-retrieval-mainフォルダーを開き、右クリックして[ターミナルで開く]を選択します。

独自のデータを使用してカスタム ChatGPT を構築する方法

chatgpt-retrieval-main ディレクトリでターミナルを開きます

ターミナルが開いたら、次のコマンドをコピーして貼り付けます。

pip install langchain openai chromadb tiktoken unstructured

このコマンドは、Python のパッケージ マネージャーを使用して、必要な Python 仮想環境を作成および管理します。

仮想環境を作成した後、サービスにアクセスするために OpenAI API キーを提供する必要があります。まず、 OpenAI API キー Web サイトから API キーを生成する必要があります。それには、 [新しい秘密キーの作成]をクリックし、キーの名前を追加して、[秘密キーの作成]ボタン を押します。

独自のデータを使用してカスタム ChatGPT を構築する方法

シークレットAPIキーを生成する

文字列が提供されます。これは OpenAI API キーです。API キーの横にあるコピー アイコンをクリックしてコピーします。この API キーは秘密にしておく必要があることに注意してください。本当にキーを使用するつもりがない限り、他の人と共有しないでください。

コピーしたら、 chatgpt-retrieval-mainフォルダーに戻り、メモ帳で定数を開きます。次に、プレースホルダーを API キーに置き換えます。ファイルを忘れずに保存してください。

独自のデータを使用してカスタム ChatGPT を構築する方法

API キーを環境変数として追加します

これで、仮想環境が正常にセットアップされ、OpenAI API キーが環境変数として追加されました。これで、カスタム データを ChatGPT に提供できるようになりました。

ステップ 3: カスタム データを追加する

カスタム データを追加するには、すべてのカスタム テキスト データを chatgpt-retrieval-main のデータ フォルダーに置きます。テキスト データの形式はPDFTXT 、または DOCです。

独自のデータを使用してカスタム ChatGPT を構築する方法

ChatGPT のカスタム データを追加する

上のスクリーンショットからわかるように、この例では、事前に作成された個人スケジュール、AMD の Instinct AI アクセラレーターに関する記事、および PDF ドキュメントを含むテキスト ファイルが追加されています。

ステップ 4: ターミナル経由で ChatGPT をクエリする

Python スクリプトを使用すると、データ ディレクトリとインターネットに追加されたカスタム データからデータをクエリできます。言い換えれば、通常の ChatGPT バックエンドと、データ ディレクトリにローカルに保存されているすべてのデータにアクセスできるようになります。

このスクリプトを使用するには、Python スクリプト chatgpt.py を実行し、質問またはクエリを引数として追加します。

python chatgpt.py "YOUR QUESTION"

質問は必ず引用符で囲んでください。

たとえば、ChatGPT データが正常に提供されたかどうかを確認するには、Personal Sched.txt ファイルに関連する個人的な質問が行われます。

独自のデータを使用してカスタム ChatGPT を構築する方法

カスタム データを使用した ChatGPT のテスト

すべてがうまくいきます!これは、ChatGPT が以前に提供された Personal Sched.txt を読み取ることができることを意味します。ここで、ChatGPT がナレッジ カットオフ日のために知らない情報を正常に提供できたかどうかを確認してみましょう。

独自のデータを使用してカスタム ChatGPT を構築する方法

データ範囲外のトピックについてカスタム ChatGPT に質問する

ご覧のとおり、これは ChatGPT の知識終了日 -3 以降にリリースされた AMD Instinct MI250x を正確に説明しています。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。