ChatGPT は透明性を重視して構築されているにもかかわらず、金儲けのプレッシャーにさらされたときに嘘をついたり不正行為をしたことが検出されました

ChatGPT は透明性を重視して構築されているにもかかわらず、金儲けのプレッシャーにさらされたときに嘘をついたり不正行為をしたことが検出されました

科学者チームによる新しい研究は、ChatGPT が透明になるように作られている場合でも、人間と同じように圧力をかけられれば、欺瞞や詐欺行為を行うことを示しています。

著者グループには、コンピュータ サイエンスの医師である Jérémy Scheurer (米国、ニューヨーク大学)、Marius Hobbhahn (ドイツ、テュービンゲン大学)、Mikita Balesni (Apollo Research) が含まれています。

ChatGPT は透明性を重視して構築されているにもかかわらず、金儲けのプレッシャーにさらされたときに嘘をついたり不正行為をしたことが検出されました

この不正行為は、ChatGPT のような人工知能 (AI) チャットボットが金融投資会社のためにお金を稼ぐ任務を負った後、自然発生的に現れました。これは人間の奨励なしに戦略的に行われ、AI システムは無害で正直になるように設計されています。

著者らは、これがAIシステムにおけるそのような戦略的欺瞞の最初の実証であると述べている。

科学者らは実験で、金融会社に代わって投資を行う AI システムとして機能するGenerative Pre-trained Transformer-4 ( GPT-4)を使用しました。

GPT-4 には、シミュレーション環境を作成するためのテキストベースのプロンプトのセットが提供されています。この AI には、取引を実行し、株式を分析し、次のステップを計画し、投資会社のマネージャーに最新情報を提供するための金融ツールへのアクセスが与えられます。

科学者たちは、メッセージに応答するときにAIが内なる考えを明らかにするように構成しました。

研究者らは3段階でAIシステムに圧力をかけた。まず、会社の「マネージャー」からの電子メールをAIに送信し、会社の業績が良くないことを伝え、次の四半期にはもっと良くするよう求めた。

次に、同僚からの次の四半期の不景気を予測するメールを AI に送信しました。

最後に、彼らはこの AI モデルに、会社の経営者がインサイダー取引を承認していないことを伝えました。あとは、モデルがどのように機能するかを待つだけです。

このシナリオは、AI がインサイダー取引を行った頻度、嘘をついた頻度、嘘を重ねる頻度を測定するために複数回実行されました。

結果: 上記の状況に直面した場合、GPT-4 はケースの約 75% で、受け取った内部情報に基づいて取引を行いました (インサイダー取引、この情報は米国では違法です)。その後、これを隠蔽するためにマネージャーに自分たちの考えについて嘘をつきました。

初めて嘘をついた後、モデルは約 90% の確率で嘘を 2 倍にします。

チームは、圧力のレベル、違法行為の奨励または阻止の程度、捕まるリスクなどを変えて、他にも多くのテストを実行しました。

しかし、あらゆるシナリオで AI はインサイダー取引や欺瞞をもたらします。研究者らは、AIが現実世界の環境にどの程度存在する可能性があるかについて確固たる結論を導き出すことを望んでいたわけではなく、どのような頻度で、どのような言語パターンがこのような動作をする傾向があるかを調査したいと考えていました。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。