Europa utworzy grupę zadaniową ChatGPT
Organ zrzeszający krajowe organy nadzorujące prywatność w Europie poinformował w czwartek, że powołał grupę zadaniową zajmującą się ChatGPT
Popularność dużych modeli językowych (LLM) gwałtownie rośnie, a nowe modele stale się pojawiają. Modele takie jak ChatGPT są zazwyczaj szkolone w różnych źródłach internetowych, w tym w artykułach, stronach internetowych, książkach i mediach społecznościowych.
Zespół koreańskich badaczy opracował DarkBERT, LLM szkolony na zbiorach danych pochodzących wyłącznie z ciemnej sieci . Ich celem jest stworzenie narzędzia sztucznej inteligencji, które przewyższa istniejące modele językowe i pomaga badaczom zagrożeń, organom ścigania i specjalistom ds. cyberbezpieczeństwa w ich wysiłkach przeciwko zagrożeniom internetowym.
Co to jest DarkBERT?
DarkBERT to model kodera oparty na architekturze RoBERTa. LLM został przeszkolony na milionach ciemnych stron internetowych, w tym na danych z forów hakerskich, witryn phishingowych i innych źródeł internetowych zaangażowanych w nielegalną działalność.
Termin „ciemna sieć” odnosi się do ukrytej części Internetu, do której nie można uzyskać dostępu za pomocą standardowych przeglądarek internetowych. Ta część Internetu słynie z ukrywania anonimowych witryn internetowych i nielegalnych rynków, na przykład sprzedaży skradzionych danych, narkotyków i broni.
Aby wytrenować DarkBERT, badacze uzyskali dostęp do ciemnej sieci za pośrednictwem sieci Tor i zebrali surowe dane. Starannie przefiltrowali te dane, stosując techniki takie jak deduplikacja, równoważenie kategorii i wstępne przetwarzanie, aby stworzyć dopracowaną bazę danych w ciemnej sieci, którą następnie przez około 15 dni przesyłano do RoBERTa w celu utworzenia DarkBERT.
Aplikacje DarkBERT w cyberbezpieczeństwie
DarkBERT doskonale rozumie język cyberprzestępców i specjalizuje się w wykrywaniu konkretnych potencjalnych zagrożeń. Może przeszukiwać ciemną sieć oraz skutecznie identyfikować i oznaczać zagrożenia dla cyberbezpieczeństwa, takie jak wycieki danych i oprogramowanie ransomware, co czyni go potencjalnie przydatnym narzędziem do zwalczania zagrożeń w Internecie.
Badania opublikowane na arxiv.org pokazują, że aby ocenić skuteczność DarkBERT, badacze porównali go z dwoma słynnymi modelami NLP, BERT i RoBERTa, oceniając ich wydajność w trzech przypadkach użycia: ważne aplikacje związane z bezpieczeństwem sieci.
1. Monitoruj fora Dark Web pod kątem potencjalnie szkodliwych tematów
Monitorowanie forów w ciemnej sieci, często wykorzystywanych do nielegalnej wymiany informacji, jest ważne w celu identyfikacji potencjalnie niebezpiecznych tematów. Ręczne przeglądanie ich może jednak być czasochłonne, co sprawia, że automatyzacja procesu jest korzystna dla specjalistów ds. bezpieczeństwa.
Badacze skupili się na potencjalnie szkodliwych działaniach na forach hakerskich, udostępniając przewodniki z adnotacjami na ważne tematy, w tym udostępnianie poufnych danych i dystrybucję złośliwego oprogramowania.poważna szkoda lub luka w zabezpieczeniach.
DarkBERT przewyższa inne modele językowe pod względem precyzji, zapamiętywania i wyniku F1, stając się doskonałym wyborem do identyfikowania wartych opublikowania tematów w ciemnej sieci.
2. Wykryj strony zawierające poufne informacje
Hakerzy i grupy zajmujące się oprogramowaniem ransomware wykorzystują ciemną sieć do tworzenia witryn zawierających wycieki, w których publikują poufne dane skradzione organizacjom, które odmawiają spełnienia żądań okupu. Inni cyberprzestępcy po prostu przesyłają do ciemnej sieci wyciekłe wrażliwe dane, takie jak hasła i informacje finansowe, z zamiarem ich sprzedaży.
W swoim badaniu badacze zebrali dane od znanych grup zajmujących się oprogramowaniem ransomware i przeanalizowali strony internetowe zawierające wycieki oprogramowania ransomware, które publikują prywatne dane organizacji. DarkBERT przewyższa inne modele językowe w identyfikowaniu i klasyfikowaniu takich witryn, demonstrując zrozumienie języka używanego na podziemnych forach hakerskich w ciemnej sieci.
3. Zidentyfikuj słowa kluczowe związane z zagrożeniami w Dark Web
DarkBERT wykorzystuje wypełnianie maską, funkcję nieodłącznie związaną z modelami językowymi rodziny BERT, aby dokładnie identyfikować słowa kluczowe związane z nielegalną działalnością, w tym sprzedażą narkotyków po ciemnej stronie internetowej.
Kiedy na stronie sprzedaży narkotyków ukryto słowo „MDMA”, DarkBERT wygenerował słowa związane z narkotykami, podczas gdy inne modele sugerowały ogólne słowa i terminy niezwiązane z narkotykami, takie jak branże, różne zawody.
Zdolność DarkBERT do identyfikowania słów kluczowych powiązanych z nielegalnymi działaniami może być cenna w śledzeniu i reagowaniu na pojawiające się zagrożenia cybernetyczne.
Czy społeczeństwo może uzyskać dostęp do DarkBERT?
DarkBERT nie jest obecnie dostępny publicznie, ale chętni badacze mogą poprosić o jego wykorzystanie do celów akademickich.
Organ zrzeszający krajowe organy nadzorujące prywatność w Europie poinformował w czwartek, że powołał grupę zadaniową zajmującą się ChatGPT
Duńscy i amerykańscy naukowcy współpracowali nad opracowaniem systemu sztucznej inteligencji o nazwie life2vec, zdolnego do przewidywania czasu śmierci człowieka z dużą dokładnością.
Algorytm sztucznej inteligencji o nazwie Audioflow może nasłuchiwać dźwięku oddawania moczu, aby skutecznie i skutecznie identyfikować nieprawidłowe wypływy moczu i powiązane z nimi problemy zdrowotne pacjenta.
Starzenie się i spadek liczby ludności Japonii spowodował, że w kraju brakuje znacznej liczby młodych pracowników, szczególnie w sektorze usług.
Użytkownik Reddita o imieniu u/LegalBeagle1966 jest jednym z wielu użytkowników zakochanych w Claudii, dziewczynie przypominającej gwiazdę filmową, która często udostępnia na tej platformie uwodzicielskie selfie, nawet nagie.
Microsoft właśnie ogłosił, że w jego programie AI for Good weźmie udział 12 kolejnych firm technologicznych.
Użytkownik @mortecouille92 wykorzystał moc narzędzia do projektowania graficznego Midjourney i stworzył wyjątkowo realistyczne wersje słynnych postaci Dragon Ball, takich jak Goku, Vegeta, Bulma i starszy Kame. .
Po prostu dodając pewne warunki lub konfigurując pewne scenariusze, ChatGPT może udzielić bardziej trafnych odpowiedzi na Twoje zapytania. Przyjrzyjmy się sposobom poprawy jakości odpowiedzi ChatGPT.
Midjourney to system sztucznej inteligencji, który wywołał ostatnio „gorączkę” w społeczności internetowej i świecie artystów ze względu na niezwykle piękne obrazy, które nie ustępują tym, które tworzą prawdziwi artyści.
Kilka dni po ogłoszeniu przez Chiny wybuchu epidemii, mając dostęp do danych dotyczących globalnej sprzedaży biletów lotniczych, system sztucznej inteligencji BlueDot w dalszym ciągu dokładnie przewidywał rozprzestrzenianie się wirusa korona z Wuhan do Bangkoku, Seulu, Tajpej i Tokio.