Wat is DarkBERT? Kan AI cyberdreigingen helpen bestrijden?

De populariteit van grote taalmodellen (LLM's) stijgt enorm en er verschijnen voortdurend nieuwe modellen. Modellen zoals ChatGPT worden doorgaans getraind op een verscheidenheid aan internetbronnen, waaronder artikelen, websites, boeken en sociale media.

Een team van Koreaanse onderzoekers ontwikkelde DarkBERT, een LLM die is getraind in datasets die uitsluitend afkomstig zijn van het dark web . Hun doel is om een AI-tool te creëren die beter presteert dan bestaande taalmodellen en die dreigingsonderzoekers, wetshandhavings- en cyberbeveiligingsprofessionals helpt bij hun inspanningen tegen online dreigingen.

Wat is DarkBERT?

DarkBERT is een encodermodel gebaseerd op de RoBERTa-architectuur. LLM is getraind op miljoenen dark websites, inclusief gegevens van hackforums, phishing-sites en andere online bronnen die betrokken zijn bij illegale activiteiten.

De term ‘dark web’ verwijst naar een verborgen deel van het internet dat niet toegankelijk is via standaard webbrowsers. Dit deel van het internet is berucht omdat het anonieme websites en illegale markten herbergt, zoals de verkoop van gestolen gegevens, drugs en wapens.

Om DarkBERT te trainen, kregen onderzoekers via het Tor-netwerk toegang tot het dark web en verzamelden ze ruwe gegevens. Ze hebben deze gegevens zorgvuldig gefilterd met behulp van technieken zoals deduplicatie, categorieverdeling en voorverwerking om een verfijnde dark web-database te creëren, die vervolgens gedurende ongeveer 15 dagen aan RoBERTa werd ingevoerd om DarkBERT te creëren.

DarkBERT-toepassingen in cyberbeveiliging

Wat is DarkBERT? Kan AI cyberdreigingen helpen bestrijden?

DarkBERT heeft een superieur begrip van de taal van cybercriminelen en blinkt uit in het detecteren van specifieke potentiële bedreigingen. Het kan het dark web onderzoeken en met succes cyberbedreigingen zoals datalekken en ransomware identificeren en signaleren, waardoor het een potentieel nuttig hulpmiddel is om online bedreigingen te bestrijden.

Uit onderzoek op arxiv.org blijkt dat onderzoekers, om de effectiviteit van DarkBERT te evalueren, het vergeleken met twee beroemde NLP-modellen, BERT en RoBERTa, waarbij hun prestaties in drie belangrijke toepassingen met betrekking tot netwerkbeveiliging werden geëvalueerd.

1. Controleer Dark Web-forums op mogelijk schadelijke onderwerpen

Het monitoren van dark web-forums, die vaak worden gebruikt voor illegale informatie-uitwisseling, is belangrijk om potentieel gevaarlijke onderwerpen te identificeren. Het handmatig beoordelen hiervan kan echter tijdrovend zijn, waardoor het automatiseren van het proces gunstig is voor beveiligingsprofessionals.

De onderzoekers concentreerden zich op potentieel schadelijke activiteiten op hackforums en gaven geannoteerde handleidingen voor opmerkelijke onderwerpen, waaronder het delen van vertrouwelijke gegevens en het verspreiden van malware, ernstige schade of kwetsbaarheid.

DarkBERT presteert beter dan andere taalmodellen op het gebied van precisie, herinnering en F1-score en komt naar voren als een superieure keuze voor het identificeren van nieuwswaardige onderwerpen op het dark web.

2. Detecteer pagina's die vertrouwelijke informatie bevatten

Hackers en ransomwaregroepen gebruiken het dark web om lekkende websites te maken waarop ze vertrouwelijke gegevens publiceren die zijn gestolen van organisaties die weigeren te voldoen aan losgeldeisen. Andere cybercriminelen uploaden eenvoudigweg gelekte gevoelige gegevens, zoals wachtwoorden en financiële informatie, naar het dark web met de bedoeling deze te verkopen.

In hun onderzoek verzamelden de onderzoekers gegevens van beruchte ransomwaregroepen en analyseerden ze ransomware-lekkende websites die privégegevens van organisaties publiceren. DarkBERT presteert beter dan andere taalmodellen bij het identificeren en classificeren van dergelijke sites, waarmee het zijn begrip aantoont van de taal die wordt gebruikt in ondergrondse hackforums op het dark web.

3. Identificeer trefwoorden die verband houden met bedreigingen op het Dark Web

Wat is DarkBERT? Kan AI cyberdreigingen helpen bestrijden?

DarkBERT maakt gebruik van maskervulling, een functie die inherent is aan BERT-familietaalmodellen, om nauwkeurig trefwoorden te identificeren die verband houden met illegale activiteiten, waaronder de verkoop van drugs op het dark side.web.

Toen het woord "MDMA" verborgen was op een verkooppagina voor drugs, genereerde DarkBERT drugsgerelateerde woorden, terwijl andere modellen generieke, niet-drugsgerelateerde woorden en termen suggereerden, zoals sectoren en verschillende beroepen.

Het vermogen van DarkBERT om trefwoorden te identificeren die verband houden met illegale activiteiten kan waardevol zijn bij het opsporen en aanpakken van opkomende cyberdreigingen.

Kan het publiek toegang krijgen tot DarkBERT?

DarkBERT is momenteel niet beschikbaar voor het publiek, maar bereidwillige onderzoekers kunnen het gebruik ervan voor academische doeleinden aanvragen.

Laat een reactie achter

De ChatGPT-taskforce zal door Europa worden opgericht

Het orgaan dat de nationale privacywaakhonden van Europa verenigt, zei donderdag dat het een taskforce heeft opgericht die zich specifiek bezighoudt met ChatGPT

AI voorspelt het tijdstip van de menselijke dood met een nauwkeurigheid van 78%

Deense en Amerikaanse wetenschappers hebben samengewerkt om een AI-systeem te ontwikkelen genaamd life2vec, dat in staat is om het tijdstip van menselijke dood met hoge nauwkeurigheid te voorspellen.

AI voorspelt urinewegaandoeningen alleen al op basis van het geluid van urine

Een AI-algoritme genaamd Audioflow kan naar het geluid van het plassen luisteren om abnormale stromingen en bijbehorende gezondheidsproblemen van de patiënt effectief en met succes te identificeren.

Barmannen opgelet: deze robot kan in slechts 1 minuut een cocktail mixen

Door de vergrijzing en de afnemende bevolking van Japan heeft het land een aanzienlijk aantal jonge werknemers nodig, vooral in de dienstensector.

Honderden mensen waren gedesillusioneerd toen ze hoorden dat het meisje van wie ze hielden een product van AI was

Een Reddit-gebruiker genaamd u/LegalBeagle1966 is een van de vele gebruikers die verliefd zijn op Claudia, een filmsterachtig meisje dat vaak verleidelijke selfies deelt, zelfs naakte, op dit platform.

Nog twaalf potentiële bedrijven sluiten zich aan bij de AI-alliantie van Microsoft.

Microsoft heeft zojuist aangekondigd dat nog twaalf technologiebedrijven zullen deelnemen aan zijn AI for Good-programma.

AI herschept Dragon Ball-personages in vlees en bloed

Gebruiker @mortecouille92 heeft de kracht van de grafische ontwerptool Midjourney aan het werk gezet en uniek realistische versies gemaakt van beroemde Dragon Ball-personages zoals Goku, Vegeta, Bulma en oudere Kame.

7 technieken om ChatGPT-reacties te verbeteren

Door enkele voorwaarden toe te voegen of enkele scenario's in te stellen, kan ChatGPT relevantere antwoorden op uw vragen geven. Laten we eens kijken naar enkele manieren waarop u de kwaliteit van uw ChatGPT-reacties kunt verbeteren.

Bewonder de prachtige schilderijen getekend door kunstmatige intelligentie

Midjourney is een kunstmatig intelligentiesysteem dat de laatste tijd voor ‘koorts’ zorgt in de online community en de kunstenaarswereld vanwege zijn buitengewoon mooie schilderijen die niet onderdoen voor die van echte kunstenaars.

Dit AI-model was een van de eerste ‘experts’ die nieuws ontdekte over de uitbraak van Wuhan-longontsteking.

Dagen nadat China de uitbraak had aangekondigd, bleef het AI-systeem van BlueDot, met toegang tot wereldwijde gegevens over de verkoop van vliegtickets, nauwkeurig de verspreiding van het Wuhan Corona-virus naar Bangkok, Seoul, Taipei en Tokio voorspellen.