Co to jest DarkBERT? Czy sztuczna inteligencja może pomóc w walce z cyberzagrożeniami?

Co to jest DarkBERT? Czy sztuczna inteligencja może pomóc w walce z cyberzagrożeniami?

Popularność dużych modeli językowych (LLM) gwałtownie rośnie, a nowe modele stale się pojawiają. Modele takie jak ChatGPT są zazwyczaj szkolone w różnych źródłach internetowych, w tym w artykułach, stronach internetowych, książkach i mediach społecznościowych.

Zespół koreańskich badaczy opracował DarkBERT, LLM szkolony na zbiorach danych pochodzących wyłącznie z ciemnej sieci . Ich celem jest stworzenie narzędzia sztucznej inteligencji, które przewyższa istniejące modele językowe i pomaga badaczom zagrożeń, organom ścigania i specjalistom ds. cyberbezpieczeństwa w ich wysiłkach przeciwko zagrożeniom internetowym.

Co to jest DarkBERT?

DarkBERT to model kodera oparty na architekturze RoBERTa. LLM został przeszkolony na milionach ciemnych stron internetowych, w tym na danych z forów hakerskich, witryn phishingowych i innych źródeł internetowych zaangażowanych w nielegalną działalność.

Termin „ciemna sieć” odnosi się do ukrytej części Internetu, do której nie można uzyskać dostępu za pomocą standardowych przeglądarek internetowych. Ta część Internetu słynie z ukrywania anonimowych witryn internetowych i nielegalnych rynków, na przykład sprzedaży skradzionych danych, narkotyków i broni.

Aby wytrenować DarkBERT, badacze uzyskali dostęp do ciemnej sieci za pośrednictwem sieci Tor i zebrali surowe dane. Starannie przefiltrowali te dane, stosując techniki takie jak deduplikacja, równoważenie kategorii i wstępne przetwarzanie, aby stworzyć dopracowaną bazę danych w ciemnej sieci, którą następnie przez około 15 dni przesyłano do RoBERTa w celu utworzenia DarkBERT.

Aplikacje DarkBERT w cyberbezpieczeństwie

Co to jest DarkBERT?  Czy sztuczna inteligencja może pomóc w walce z cyberzagrożeniami?

DarkBERT doskonale rozumie język cyberprzestępców i specjalizuje się w wykrywaniu konkretnych potencjalnych zagrożeń. Może przeszukiwać ciemną sieć oraz skutecznie identyfikować i oznaczać zagrożenia dla cyberbezpieczeństwa, takie jak wycieki danych i oprogramowanie ransomware, co czyni go potencjalnie przydatnym narzędziem do zwalczania zagrożeń w Internecie.

Badania opublikowane na arxiv.org pokazują, że aby ocenić skuteczność DarkBERT, badacze porównali go z dwoma słynnymi modelami NLP, BERT i RoBERTa, oceniając ich wydajność w trzech przypadkach użycia: ważne aplikacje związane z bezpieczeństwem sieci.

1. Monitoruj fora Dark Web pod kątem potencjalnie szkodliwych tematów

Monitorowanie forów w ciemnej sieci, często wykorzystywanych do nielegalnej wymiany informacji, jest ważne w celu identyfikacji potencjalnie niebezpiecznych tematów. Ręczne przeglądanie ich może jednak być czasochłonne, co sprawia, że ​​automatyzacja procesu jest korzystna dla specjalistów ds. bezpieczeństwa.

Badacze skupili się na potencjalnie szkodliwych działaniach na forach hakerskich, udostępniając przewodniki z adnotacjami na ważne tematy, w tym udostępnianie poufnych danych i dystrybucję złośliwego oprogramowania.poważna szkoda lub luka w zabezpieczeniach.

DarkBERT przewyższa inne modele językowe pod względem precyzji, zapamiętywania i wyniku F1, stając się doskonałym wyborem do identyfikowania wartych opublikowania tematów w ciemnej sieci.

2. Wykryj strony zawierające poufne informacje

Hakerzy i grupy zajmujące się oprogramowaniem ransomware wykorzystują ciemną sieć do tworzenia witryn zawierających wycieki, w których publikują poufne dane skradzione organizacjom, które odmawiają spełnienia żądań okupu. Inni cyberprzestępcy po prostu przesyłają do ciemnej sieci wyciekłe wrażliwe dane, takie jak hasła i informacje finansowe, z zamiarem ich sprzedaży.

W swoim badaniu badacze zebrali dane od znanych grup zajmujących się oprogramowaniem ransomware i przeanalizowali strony internetowe zawierające wycieki oprogramowania ransomware, które publikują prywatne dane organizacji. DarkBERT przewyższa inne modele językowe w identyfikowaniu i klasyfikowaniu takich witryn, demonstrując zrozumienie języka używanego na podziemnych forach hakerskich w ciemnej sieci.

3. Zidentyfikuj słowa kluczowe związane z zagrożeniami w Dark Web

Co to jest DarkBERT?  Czy sztuczna inteligencja może pomóc w walce z cyberzagrożeniami?

DarkBERT wykorzystuje wypełnianie maską, funkcję nieodłącznie związaną z modelami językowymi rodziny BERT, aby dokładnie identyfikować słowa kluczowe związane z nielegalną działalnością, w tym sprzedażą narkotyków po ciemnej stronie internetowej.

Kiedy na stronie sprzedaży narkotyków ukryto słowo „MDMA”, DarkBERT wygenerował słowa związane z narkotykami, podczas gdy inne modele sugerowały ogólne słowa i terminy niezwiązane z narkotykami, takie jak branże, różne zawody.

Zdolność DarkBERT do identyfikowania słów kluczowych powiązanych z nielegalnymi działaniami może być cenna w śledzeniu i reagowaniu na pojawiające się zagrożenia cybernetyczne.

Czy społeczeństwo może uzyskać dostęp do DarkBERT?

DarkBERT nie jest obecnie dostępny publicznie, ale chętni badacze mogą poprosić o jego wykorzystanie do celów akademickich.


Europa utworzy grupę zadaniową ChatGPT

Europa utworzy grupę zadaniową ChatGPT

Organ zrzeszający krajowe organy nadzorujące prywatność w Europie poinformował w czwartek, że powołał grupę zadaniową zajmującą się ChatGPT

AI przewiduje czas śmierci człowieka z 78% dokładnością

AI przewiduje czas śmierci człowieka z 78% dokładnością

Duńscy i amerykańscy naukowcy współpracowali nad opracowaniem systemu sztucznej inteligencji o nazwie life2vec, zdolnego do przewidywania czasu śmierci człowieka z dużą dokładnością.

Sztuczna inteligencja przewiduje choroby układu moczowego na podstawie dźwięku moczu

Sztuczna inteligencja przewiduje choroby układu moczowego na podstawie dźwięku moczu

Algorytm sztucznej inteligencji o nazwie Audioflow może nasłuchiwać dźwięku oddawania moczu, aby skutecznie i skutecznie identyfikować nieprawidłowe wypływy moczu i powiązane z nimi problemy zdrowotne pacjenta.

Barmani, uważajcie: ten robot może przygotować koktajl w zaledwie 1 minutę

Barmani, uważajcie: ten robot może przygotować koktajl w zaledwie 1 minutę

Starzenie się i spadek liczby ludności Japonii spowodował, że w kraju brakuje znacznej liczby młodych pracowników, szczególnie w sektorze usług.

Setki ludzi rozczarowało się, gdy dowiedziały się, że dziewczyna, którą kochają, jest wytworem sztucznej inteligencji

Setki ludzi rozczarowało się, gdy dowiedziały się, że dziewczyna, którą kochają, jest wytworem sztucznej inteligencji

Użytkownik Reddita o imieniu u/LegalBeagle1966 jest jednym z wielu użytkowników zakochanych w Claudii, dziewczynie przypominającej gwiazdę filmową, która często udostępnia na tej platformie uwodzicielskie selfie, nawet nagie.

12 kolejnych potencjalnych firm dołącza do „sojuszu AI” Microsoftu.

12 kolejnych potencjalnych firm dołącza do „sojuszu AI” Microsoftu.

Microsoft właśnie ogłosił, że w jego programie AI for Good weźmie udział 12 kolejnych firm technologicznych.

Sztuczna inteligencja odtwarza postacie Dragon Ball z krwi i kości

Sztuczna inteligencja odtwarza postacie Dragon Ball z krwi i kości

Użytkownik @mortecouille92 wykorzystał moc narzędzia do projektowania graficznego Midjourney i stworzył wyjątkowo realistyczne wersje słynnych postaci Dragon Ball, takich jak Goku, Vegeta, Bulma i starszy Kame. .

7 technik poprawy odpowiedzi ChatGPT

7 technik poprawy odpowiedzi ChatGPT

Po prostu dodając pewne warunki lub konfigurując pewne scenariusze, ChatGPT może udzielić bardziej trafnych odpowiedzi na Twoje zapytania. Przyjrzyjmy się sposobom poprawy jakości odpowiedzi ChatGPT.

Podziwiaj piękne obrazy narysowane przez sztuczną inteligencję

Podziwiaj piękne obrazy narysowane przez sztuczną inteligencję

Midjourney to system sztucznej inteligencji, który wywołał ostatnio „gorączkę” w społeczności internetowej i świecie artystów ze względu na niezwykle piękne obrazy, które nie ustępują tym, które tworzą prawdziwi artyści.

Ten model sztucznej inteligencji był jednym z pierwszych „ekspertów”, którzy odkryli wiadomości o wybuchu zapalenia płuc w Wuhan.

Ten model sztucznej inteligencji był jednym z pierwszych „ekspertów”, którzy odkryli wiadomości o wybuchu zapalenia płuc w Wuhan.

Kilka dni po ogłoszeniu przez Chiny wybuchu epidemii, mając dostęp do danych dotyczących globalnej sprzedaży biletów lotniczych, system sztucznej inteligencji BlueDot w dalszym ciągu dokładnie przewidywał rozprzestrzenianie się wirusa korona z Wuhan do Bangkoku, Seulu, Tajpej i Tokio.