Ce este DarkBERT? Poate AI ajuta la combaterea amenințărilor cibernetice?

Ce este DarkBERT? Poate AI ajuta la combaterea amenințărilor cibernetice?

Popularitatea modelelor de limbaj mari (LLM) este în creștere vertiginoasă, cu noi modele care apar în mod constant. Modele precum ChatGPT sunt de obicei instruite pe o varietate de surse de internet, inclusiv articole, site-uri web, cărți și rețele sociale.

O echipă de cercetători coreeni a dezvoltat DarkBERT, un LLM instruit pe seturi de date provenite exclusiv din dark web . Scopul lor este de a crea un instrument de inteligență artificială care depășește modelele lingvistice existente și ajută cercetătorii amenințărilor, forțele de ordine și profesioniștii în securitate cibernetică în eforturile lor împotriva amenințărilor online.

Ce este DarkBERT?

DarkBERT este un model de codificator bazat pe arhitectura Roberta. LLM a fost instruit pe milioane de site-uri web întunecate, inclusiv date de pe forumuri de hacking, site-uri de phishing și alte surse online implicate în activități ilegale.

Termenul „web întunecat” se referă la o parte ascunsă a Internetului care nu este accesibilă prin browserele web standard. Această parte a internetului este renumită pentru că adăpostește site-uri web anonime și piețe ilegale, cum ar fi vânzarea de date, droguri și arme furate.

Pentru a instrui DarkBERT, cercetătorii au obținut acces la dark web prin intermediul rețelei Tor și au colectat date brute. Ei au filtrat cu atenție aceste date folosind tehnici precum deduplicarea, echilibrarea categoriilor și preprocesarea pentru a crea o bază de date dark web reglată, care a fost apoi transmisă lui Roberta timp de aproximativ 15 zile pentru a crea DarkBERT.

Aplicații DarkBERT în securitatea cibernetică

Ce este DarkBERT?  Poate AI ajuta la combaterea amenințărilor cibernetice?

DarkBERT are o înțelegere superioară a limbajului infractorilor cibernetici și excelează în detectarea amenințărilor potențiale specifice. Poate cerceta rețeaua întunecată și poate identifica și semnaliza cu succes amenințările de securitate cibernetică, cum ar fi scurgerile de date și ransomware, făcându-l un instrument potențial util pentru combaterea amenințărilor online.

Cercetările postate pe arxiv.org arată că pentru a evalua eficacitatea DarkBERT, cercetătorii l-au comparat cu două modele celebre NLP, BERT și RoBERTa, evaluându-le performanța în trei cazuri de utilizare importante aplicații legate de securitatea rețelei.

1. Monitorizați forumurile Dark Web pentru subiecte potențial dăunătoare

Monitorizarea forumurilor dark web, adesea folosite pentru schimburi ilegale de informații, este importantă pentru a identifica subiectele potențial periculoase. Cu toate acestea, revizuirea manuală a acestora poate fi consumatoare de timp, făcând automatizarea procesului benefică pentru profesioniștii în securitate.

Cercetătorii s-au concentrat asupra activităților potențial dăunătoare din forumurile de hacking, oferind ghiduri adnotate pentru subiecte notabile, inclusiv schimbul de date confidențiale și distribuirea de programe malware, vătămări grave sau vulnerabilități.

DarkBERT depășește alte modele lingvistice în ceea ce privește precizia, reamintirea și scorul F1, devenind o alegere superioară pentru identificarea subiectelor demne de știri pe dark web.

2. Detectați paginile care găzduiesc informații confidențiale

Hackerii și grupurile de ransomware folosesc web-ul întunecat pentru a crea site-uri web cu scurgeri de informații unde publică date confidențiale furate de la organizații care refuză să se conformeze cererilor de răscumpărare. Alți criminali cibernetici încarcă pur și simplu date sensibile scurse, cum ar fi parole și informații financiare, pe dark web cu intenția de a le vinde.

În studiul lor, cercetătorii au colectat date de la grupuri notorii de ransomware și au analizat site-uri web cu scurgeri de ransomware care publică date private ale organizațiilor. DarkBERT depășește alte modele de limbaj în identificarea și clasificarea unor astfel de site-uri, demonstrând înțelegerea limbajului folosit în forumurile de hacking underground de pe dark web.

3. Identificați cuvinte cheie legate de amenințările de pe Dark Web

Ce este DarkBERT?  Poate AI ajuta la combaterea amenințărilor cibernetice?

DarkBERT folosește umplerea măștilor, o caracteristică inerentă modelelor de limbaj al familiei BERT, pentru a identifica cu exactitate cuvintele cheie legate de activități ilegale, inclusiv vânzarea de droguri pe partea întunecată.

Când cuvântul „MDMA” a fost ascuns pe o pagină de vânzare de medicamente, DarkBERT a generat cuvinte legate de droguri, în timp ce alte modele au sugerat cuvinte și termeni generici care nu au legătură cu medicamentele, cum ar fi profesii diferite din industrii.

Capacitatea DarkBERT de a identifica cuvintele cheie asociate cu activități ilegale poate fi valoroasă în urmărirea și abordarea amenințărilor cibernetice emergente.

Publicul poate accesa DarkBERT?

DarkBERT nu este în prezent disponibil publicului, dar cercetătorii dornici pot solicita utilizarea acestuia în scopuri academice.


Grupul de lucru ChatGPT va fi înființat de Europa

Grupul de lucru ChatGPT va fi înființat de Europa

Organismul care reunește organele naționale de supraveghere a vieții private din Europa a declarat joi că a înființat un grup operativ dedicat ChatGPT

AI prezice ora morții umane cu o precizie de 78%.

AI prezice ora morții umane cu o precizie de 78%.

Oamenii de știință danezi și americani au colaborat pentru a dezvolta un sistem AI numit life2vec, capabil să prezică ora morții umane cu mare precizie.

AI prezice bolile urinare doar prin sunetul urinei

AI prezice bolile urinare doar prin sunetul urinei

Un algoritm AI numit Audioflow poate asculta sunetul urinării pentru a identifica eficient și cu succes fluxurile anormale și problemele de sănătate corespunzătoare ale pacientului.

Barmani, atenție: acest robot poate amesteca un cocktail în doar 1 minut

Barmani, atenție: acest robot poate amesteca un cocktail în doar 1 minut

Îmbătrânirea și scăderea populației din Japonia a lăsat țara lipsită de un număr semnificativ de tineri lucrători, în special în sectorul serviciilor.

Sute de oameni au fost dezamăgiți când au aflat că fata pe care o iubeau este un produs al inteligenței artificiale

Sute de oameni au fost dezamăgiți când au aflat că fata pe care o iubeau este un produs al inteligenței artificiale

Un utilizator Reddit numit u/LegalBeagle1966 este unul dintre mulți utilizatori îndrăgostiți de Claudia, o fată asemănătoare vedetei de cinema care deseori împărtășește selfie-uri seducătoare, chiar și nud, pe această platformă.

Încă 12 companii potențiale se alătură „alianței AI” a Microsoft.

Încă 12 companii potențiale se alătură „alianței AI” a Microsoft.

Microsoft tocmai a anunțat că alte 12 companii de tehnologie vor participa la programul său AI for Good.

AI recreează personajele Dragon Ball în carne și oase

AI recreează personajele Dragon Ball în carne și oase

Utilizatorul @mortecouille92 a pus în funcțiune puterea instrumentului de design grafic Midjourney și a creat versiuni realiste unice ale personajelor celebre Dragon Ball precum Goku, Vegeta, Bulma și bătrânul Kame. .

7 tehnici pentru a îmbunătăți răspunsurile ChatGPT

7 tehnici pentru a îmbunătăți răspunsurile ChatGPT

Doar prin adăugarea unor condiții sau configurarea unor scenarii, ChatGPT poate oferi răspunsuri mai relevante la întrebările dvs. Să vedem câteva modalități prin care puteți îmbunătăți calitatea răspunsurilor dvs. ChatGPT.

Minunați-vă de tablourile frumoase desenate de inteligența artificială

Minunați-vă de tablourile frumoase desenate de inteligența artificială

Midjourney este un sistem de inteligență artificială care a provocat recent o „febră” în comunitatea online și în lumea artiștilor din cauza picturilor sale extrem de frumoase, care nu sunt inferioare celor ale artiștilor adevărați.

Acest model AI a fost unul dintre primii „experți” care au descoperit știri despre focarul de pneumonie din Wuhan.

Acest model AI a fost unul dintre primii „experți” care au descoperit știri despre focarul de pneumonie din Wuhan.

La câteva zile după ce China a anunțat focarul, având acces la datele globale despre vânzările de bilete de avion, sistemul AI al BlueDot a continuat să prezică cu exactitate răspândirea virusului Wuhan Corona la Bangkok, Seul, Taipei și Tokyo.