DarkBERTとは何ですか? AI はサイバー脅威との戦いに役立つでしょうか?

DarkBERTとは何ですか? AI はサイバー脅威との戦いに役立つでしょうか?

大規模言語モデル (LLM) の人気は急速に高まっており、新しいモデルが常に登場しています。ChatGPTのようなモデルは通常、記事、Web サイト、書籍、ソーシャル メディアなど、さまざまなインターネット ソースでトレーニングされます。

韓国の研究者チームは、ダークウェブのみからソースされたデータセットでトレーニングされた LLM である DarkBERT を開発しました。彼らの目的は、既存の言語モデルを上回るパフォーマンスを発揮し、オンラインの脅威に対する脅威研究者、法執行機関、サイバーセキュリティ専門家の取り組みを支援する AI ツールを作成することです。

DarkBERTとは何ですか?

DarkBERT は、RoBERTa アーキテクチャに基づいたエンコーダ モデルです。LLM は、ハッキング フォーラム、フィッシング サイト、および違法行為に関与するその他のオンライン ソースからのデータを含む、何百万ものダーク Web サイトでトレーニングを受けてきました。

「ダークウェブ」という用語は、標準のウェブブラウザからはアクセスできない、インターネットの隠された部分を指します。インターネットのこの部分は、匿名の Web サイトや、盗まれたデータ、麻薬、武器の販売などの違法市場が存在することで有名です。

DarkBERT をトレーニングするために、研究者は Tor ネットワークを通じてダーク Web にアクセスし、生データを収集しました。彼らは、重複排除、カテゴリのバランシング、前処理などの技術を使用してこのデータを慎重にフィルタリングして、微調整されたダーク Web データベースを作成し、それを約 15 日間かけて RoBERTa に供給して DarkBERT を作成しました。

サイバーセキュリティにおける DarkBERT アプリケーション

DarkBERTとは何ですか?  AI はサイバー脅威との戦いに役立つでしょうか?

DarkBERT はサイバー犯罪者の言語をよく理解しており、特定の潜在的な脅威の検出に優れています。ダークウェブを調査し、データ漏洩やランサムウェアなどのサイバーセキュリティの脅威を特定してフラグを立てることができるため、オンラインの脅威に対抗するための潜在的に役立つツールになります。

arxiv.org に投稿された調査によると、DarkBERT の有効性を評価するために、研究者が DarkBERT を 2 つの有名な NLP モデル、BERT および RoBERTa と比較し、ネットワーク セキュリティに関連する 3 つの重要なアプリケーションのパフォーマンスを評価したことが示されています。

1. ダークウェブ フォーラムを監視して、有害な可能性のあるトピックがないか確認する

違法な情報交換によく使用されるダークウェブ フォーラムを監視することは、潜在的に危険なトピックを特定するために重要です。ただし、これらを手動で確認するには時間がかかるため、プロセスの自動化はセキュリティ専門家にとって有益です。

研究者らは、ハッキング フォーラムでの潜在的に有害な活動に焦点を当て、機密データの共有やマルウェアの配布、重大な害や脆弱性などの注目すべきトピックへの注釈付きガイドを提供しました。

DarkBERT は、精度、再現率、F1 スコアの点で他の言語モデルを上回っており、ダークウェブ上でニュース価値のあるトピックを特定するための優れた選択肢として浮上しています。

2. 機密情報をホストするページを検出する

ハッカーやランサムウェア グループは、ダーク Web を利用して漏洩 Web サイトを作成し、身代金の要求に応じることを拒否した組織から盗んだ機密データを公開します。他のサイバー犯罪者は、パスワードや財務情報などの漏洩した機密データを販売する目的でダークウェブにアップロードするだけです。

研究者らは研究の中で、悪名高いランサムウェア グループからデータを収集し、組織の個人データを公開するランサムウェア漏洩 Web サイトを分析しました。DarkBERT は、そのようなサイトの識別と分類において他の言語モデルよりも優れており、ダーク Web の地下ハッキング フォーラムで使用される言語を理解していることを示しています。

3. ダークウェブ上の脅威に関連するキーワードを特定する

DarkBERTとは何ですか?  AI はサイバー脅威との戦いに役立つでしょうか?

DarkBERT は、BERT ファミリー言語モデルに固有の機能であるマスク充填を利用して、ダークサイドでの麻薬販売などの違法行為に関連するキーワードを正確に識別します。

医薬品の販売ページで「MDMA」という単語が隠されている場合、DarkBERT は医薬品関連の単語を生成しましたが、他のモデルは業界や職業など、医薬品に関連しない一般的な単語や用語を提案しました。

DarkBERT の違法行為に関連するキーワードを識別する機能は、新たなサイバー脅威を追跡し、対処する際に役立ちます。

一般人も DarkBERT にアクセスできますか?

DarkBERT は現在一般公開されていませんが、意欲のある研究者は学術目的での使用をリクエストできます。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。