歐洲將成立ChatGPT工作小組
聯合歐洲國家隱私監管機構的機構週四表示,已成立一個專門負責 ChatGPT 的工作小組
大語言模型(LLM)的受歡迎程度正在飆升,新模型不斷出現。ChatGPT等模式通常在各種網路資源上進行訓練,包括文章、網站、書籍和社群媒體。
韓國研究人員團隊開發了 DarkBERT,這是一種專門針對來自暗網的資料集進行訓練的法學碩士。他們的目標是創建一種人工智慧工具,其性能優於現有語言模型,並協助威脅研究人員、執法部門和網路安全專業人員應對線上威脅。
什麼是 DarkBERT?
DarkBERT 是基於 RoBERTa 架構的編碼器模型。LLM 接受過數百萬個暗網網站的培訓,包括駭客論壇、網路釣魚網站和其他涉及非法活動的線上來源的資料。
術語「暗網」是指無法透過標準網路瀏覽器存取的網路隱藏部分。網路的這一部分因藏匿匿名網站和非法市場(例如出售被盜資料、毒品和武器)而臭名昭著。
為了訓練 DarkBERT,研究人員透過 Tor 網路存取暗網並收集原始資料。他們使用重複資料刪除、類別平衡和預處理等技術仔細過濾這些數據,以創建一個微調的暗網資料庫,然後將其在大約 15 天的時間內輸入 RoBERTa 以創建 DarkBERT。
DarkBERT 在網路安全的應用
DarkBERT 對網路犯罪分子的語言有深入的理解,並且擅長偵測特定的潛在威脅。它可以研究暗網並成功識別和標記資料外洩和勒索軟體等網路安全威脅,使其成為對抗線上威脅的潛在有用工具。
arxiv.org 上發布的研究表明,為了評估DarkBERT 的有效性,研究人員將其與兩個著名的NLP 模型BERT 和RoBERTa 進行了比較,評估了它們在與網路安全相關的重要應用的三個用例中的性能。
1. 監控暗網論壇是否有潛在有害的主題
監控經常用於非法資訊交換的暗網論壇對於識別潛在危險主題非常重要。然而,手動檢查這些可能非常耗時,因此自動化流程對安全專業人員來說是有益的。
研究人員專注於駭客論壇中潛在的有害活動,為值得注意的主題提供註釋的指南,包括共享機密資料和分發惡意軟體、嚴重危害或漏洞。
DarkBERT 在精確度、召回率和 F1 分數方面優於其他語言模型,成為識別暗網上有新聞價值主題的絕佳選擇。
2. 偵測包含機密資訊的頁面
駭客和勒索軟體團體利用暗網創建洩密網站,發布從拒絕遵守贖金要求的組織竊取的機密資料。其他網路犯罪分子只是將洩漏的敏感資料(例如密碼和財務資訊)上傳到暗網,意圖出售。
在他們的研究中,研究人員從臭名昭著的勒索軟體團體收集了數據,並分析了發布組織私人數據的勒索軟體洩露網站。DarkBERT 在識別和分類此類網站方面優於其他語言模型,證明了它對暗網上地下駭客論壇所使用語言的理解。
3. 辨識與暗網威脅相關的關鍵字
DarkBERT 利用遮罩填充(BERT 家族語言模型固有的功能)來準確識別與非法活動相關的關鍵字,包括黑暗面的毒品銷售。
當「MDMA」這個詞隱藏在藥品銷售頁面上時,DarkBERT 會產生與毒品相關的詞,而其他模型則建議通用的非毒品相關詞和術語,例如行業、不同職業。
DarkBERT 識別與非法活動相關的關鍵字的能力對於追蹤和解決新出現的網路威脅非常有價值。
公眾可以訪問 DarkBERT 嗎?
DarkBERT 目前尚未向公眾開放,但有意願的研究人員可以請求將其用於學術目的。
聯合歐洲國家隱私監管機構的機構週四表示,已成立一個專門負責 ChatGPT 的工作小組
丹麥和美國科學家合作開發了一種名為 life2vec 的人工智慧系統,能夠高精度預測人類死亡時間。
一種名為 Audioflow 的人工智慧演算法可以聆聽排尿的聲音,從而有效、成功地識別患者的異常尿流和相應的健康問題。
日本的老化和人口減少導致該國缺乏大量年輕工人,特別是在服務業。
名為 u/LegalBeagle1966 的 Reddit 用戶是眾多迷戀 Claudia 的用戶之一,Claudia 是一個電影明星般的女孩,經常在這個平台上分享誘人的自拍照,甚至是裸體的。
微軟剛剛宣布,又有 12 家科技公司將參與其 AI for Good 計畫。
使用者@mortecouille92利用圖形設計工具Midjourney的力量,創建了著名龍珠角色的獨特逼真版本,如悟空、貝吉塔、布瑪和老龜。
只需添加一些條件或設定一些場景,ChatGPT 就可以為您的查詢提供更相關的答案。讓我們看看可以提高 ChatGPT 響應品質的一些方法。
Midjourney是一個人工智慧系統,最近在網路社群和藝術家界引起了“熱潮”,因為它的畫作極其精美,不遜色於真正的藝術家。
在中國宣布疫情爆發幾天后,透過獲取全球機票銷售數據,BlueDot 的人工智慧系統繼續準確預測武漢冠狀病毒向曼谷、首爾、台北和東京的傳播。