Was ist DarkBERT? Kann KI bei der Bekämpfung von Cyber-Bedrohungen helfen?

Die Beliebtheit großer Sprachmodelle (LLMs) nimmt rasant zu, und es tauchen ständig neue Modelle auf. Modelle wie ChatGPT werden in der Regel auf einer Vielzahl von Internetquellen trainiert, darunter Artikel, Websites, Bücher und soziale Medien.

Ein Team koreanischer Forscher hat DarkBERT entwickelt, ein LLM, das auf Datensätzen trainiert wird, die ausschließlich aus dem Dark Web stammen . Ihr Ziel ist es, ein KI-Tool zu entwickeln, das bestehende Sprachmodelle übertrifft und Bedrohungsforscher, Strafverfolgungsbehörden und Cybersicherheitsexperten bei ihren Bemühungen gegen Online-Bedrohungen unterstützt.

Was ist DarkBERT?

DarkBERT ist ein Encodermodell, das auf der RoBERTa-Architektur basiert. LLM wurde auf Millionen von Dark-Webseiten geschult, darunter Daten aus Hacking-Foren, Phishing-Seiten und anderen Online-Quellen, die an illegalen Aktivitäten beteiligt sind.

Der Begriff „Dark Web“ bezieht sich auf einen verborgenen Teil des Internets, der über Standard-Webbrowser nicht zugänglich ist. Dieser Teil des Internets ist dafür berüchtigt, anonyme Websites und illegale Märkte wie den Verkauf gestohlener Daten, Drogen und Waffen zu beherbergen.

Um DarkBERT zu trainieren, verschafften sich Forscher über das Tor-Netzwerk Zugang zum Dark Web und sammelten Rohdaten. Sie haben diese Daten mithilfe von Techniken wie Deduplizierung, Kategorieausgleich und Vorverarbeitung sorgfältig gefiltert, um eine fein abgestimmte Dark-Web-Datenbank zu erstellen, die dann etwa 15 Tage lang an RoBERTa weitergeleitet wurde, um DarkBERT zu erstellen.

DarkBERT-Anwendungen in der Cybersicherheit

Was ist DarkBERT? Kann KI bei der Bekämpfung von Cyber-Bedrohungen helfen?

DarkBERT verfügt über ein hervorragendes Verständnis der Sprache von Cyberkriminellen und zeichnet sich durch die Erkennung spezifischer potenzieller Bedrohungen aus. Es kann das Dark Web durchforschen und Cybersicherheitsbedrohungen wie Datenlecks und Ransomware erfolgreich identifizieren und kennzeichnen, was es zu einem potenziell nützlichen Werkzeug zur Bekämpfung von Online-Bedrohungen macht.

Auf arxiv.org veröffentlichte Untersuchungen zeigen, dass Forscher zur Bewertung der Wirksamkeit von DarkBERT es mit zwei bekannten NLP-Modellen, BERT und RoBERTa, verglichen und deren Leistung in drei Anwendungsfällen bewertet haben. Wichtige Anwendungen im Zusammenhang mit der Netzwerksicherheit.

1. Überwachen Sie Dark Web-Foren auf potenziell schädliche Themen

Die Überwachung von Dark-Web-Foren, die häufig für den illegalen Informationsaustausch genutzt werden, ist wichtig, um potenziell gefährliche Themen zu identifizieren. Die manuelle Überprüfung kann jedoch zeitaufwändig sein, sodass die Automatisierung des Prozesses für Sicherheitsexperten von Vorteil ist.

Die Forscher konzentrierten sich auf potenziell schädliche Aktivitäten in Hacking-Foren und stellten kommentierte Leitfäden zu wichtigen Themen bereit, darunter die Weitergabe vertraulicher Daten und die Verbreitung von Malware. Schwerwiegender Schaden oder Schwachstelle.

DarkBERT übertrifft andere Sprachmodelle in Bezug auf Präzision, Erinnerung und F1-Score und erweist sich als überlegene Wahl für die Identifizierung aktueller Themen im Dark Web.

2. Erkennen Sie Seiten, die vertrauliche Informationen hosten

Hacker und Ransomware-Gruppen nutzen das Dark Web, um Leak-Websites zu erstellen, auf denen sie vertrauliche Daten veröffentlichen, die von Organisationen gestohlen wurden, die sich weigern, Lösegeldforderungen nachzukommen. Andere Cyberkriminelle laden geleakte vertrauliche Daten wie Passwörter und Finanzinformationen einfach ins Darknet hoch, mit der Absicht, sie zu verkaufen.

In ihrer Studie sammelten die Forscher Daten von berüchtigten Ransomware-Gruppen und analysierten Ransomware-Leak-Websites, die private Daten von Organisationen veröffentlichen. DarkBERT übertrifft andere Sprachmodelle bei der Identifizierung und Klassifizierung solcher Websites und demonstriert damit sein Verständnis der Sprache, die in Underground-Hacking-Foren im Dark Web verwendet wird.

3. Identifizieren Sie Schlüsselwörter im Zusammenhang mit Bedrohungen im Dark Web

Was ist DarkBERT? Kann KI bei der Bekämpfung von Cyber-Bedrohungen helfen?

DarkBERT nutzt das Ausfüllen von Masken, eine den Sprachmodellen der BERT-Familie inhärente Funktion, um Schlüsselwörter im Zusammenhang mit illegalen Aktivitäten, einschließlich Drogenverkäufen auf der dunklen Seite, genau zu identifizieren.

Als das Wort „MDMA“ auf einer Arzneimittelverkaufsseite ausgeblendet wurde, generierte DarkBERT drogenbezogene Wörter, während andere Modelle generische, nicht drogenbezogene Wörter und Begriffe vorschlugen, wie z. B. Branchen, unterschiedliche Berufe.

Die Fähigkeit von DarkBERT, Schlüsselwörter im Zusammenhang mit illegalen Aktivitäten zu identifizieren, kann bei der Verfolgung und Bekämpfung neu auftretender Cyber-Bedrohungen hilfreich sein.

Kann die Öffentlichkeit auf DarkBERT zugreifen?

DarkBERT ist derzeit nicht für die Öffentlichkeit zugänglich, interessierte Forscher können jedoch die Nutzung für akademische Zwecke beantragen.

Einen Kommentar hinterlassen

Die ChatGPT-Task Force wird von Europa eingerichtet

Das Gremium, das die nationalen Datenschutzbeauftragten Europas vereint, gab am Donnerstag bekannt, dass es eine Task Force für ChatGPT eingerichtet habe

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

Dänische und amerikanische Wissenschaftler haben gemeinsam ein KI-System namens life2vec entwickelt, das den Zeitpunkt des menschlichen Todes mit hoher Genauigkeit vorhersagen kann.

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

Ein KI-Algorithmus namens Audioflow kann auf das Geräusch des Urinierens hören, um abnormale Urinflüsse und entsprechende Gesundheitsprobleme des Patienten effektiv und erfolgreich zu identifizieren.

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Japans alternde und schrumpfende Bevölkerung hat dazu geführt, dass dem Land eine erhebliche Zahl junger Arbeitskräfte fehlt, insbesondere im Dienstleistungssektor.

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Ein Reddit-Benutzer namens u/LegalBeagle1966 ist einer von vielen Benutzern, die in Claudia verliebt sind, ein Mädchen wie ein Filmstar, das auf dieser Plattform oft verführerische Selfies, sogar nackte, teilt.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

Microsoft hat gerade angekündigt, dass zwölf weitere Technologieunternehmen an seinem AI for Good-Programm teilnehmen werden.

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Benutzer @mortecouille92 hat die Leistungsfähigkeit des Grafikdesign-Tools Midjourney genutzt und einzigartig realistische Versionen berühmter Dragon Ball-Charaktere wie Goku, Vegeta, Bulma und Elder Kame erstellt. .

7 Techniken zur Verbesserung von ChatGPT-Antworten

Durch einfaches Hinzufügen einiger Bedingungen oder Einrichten einiger Szenarien kann ChatGPT relevantere Antworten auf Ihre Fragen geben. Schauen wir uns einige Möglichkeiten an, wie Sie die Qualität Ihrer ChatGPT-Antworten verbessern können.

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Midjourney ist ein künstliches Intelligenzsystem, das aufgrund seiner äußerst schönen Gemälde, die denen echter Künstler in nichts nachstehen, in letzter Zeit in der Online-Community und der Künstlerwelt für „Fieber“ gesorgt hat.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Tage nachdem China den Ausbruch bekannt gegeben hatte, konnte das KI-System von BlueDot mit Zugriff auf weltweite Flugscheinverkaufsdaten die Ausbreitung des Wuhan-Corona-Virus nach Bangkok, Seoul, Taipeh und Tokio weiterhin genau vorhersagen.