Apakah DarkBERT? Bolehkah AI membantu melawan ancaman siber?

Apakah DarkBERT? Bolehkah AI membantu melawan ancaman siber?

Populariti model bahasa besar (LLM) semakin melonjak, dengan model baharu sentiasa muncul. Model seperti ChatGPT biasanya dilatih tentang pelbagai sumber Internet, termasuk artikel, tapak web, buku dan media sosial.

Pasukan penyelidik Korea membangunkan DarkBERT, LLM yang dilatih mengenai set data yang diperoleh secara eksklusif daripada web gelap . Matlamat mereka adalah untuk mencipta alat AI yang mengatasi model bahasa sedia ada dan membantu penyelidik ancaman, penguatkuasa undang-undang dan profesional keselamatan siber dalam usaha mereka. terhadap ancaman dalam talian.

Apakah DarkBERT?

DarkBERT ialah model pengekod berdasarkan seni bina RoBERTa. LLM telah dilatih di berjuta-juta tapak web gelap, termasuk data daripada forum penggodaman, tapak pancingan data dan sumber dalam talian lain yang terlibat dalam aktiviti haram.

Istilah "web gelap" merujuk kepada bahagian Internet yang tersembunyi yang tidak boleh diakses melalui pelayar web standard. Bahagian Internet ini terkenal kerana menyimpan tapak web tanpa nama dan pasaran haram, seperti penjualan data curi, dadah dan senjata.

Untuk melatih DarkBERT, penyelidik mendapat akses kepada web gelap melalui rangkaian Tor dan mengumpul data mentah. Mereka menapis data ini dengan teliti menggunakan teknik seperti penyahduplikasian, pengimbangan kategori dan pra-pemprosesan untuk mencipta pangkalan data web gelap yang diperhalusi, yang kemudiannya disalurkan kepada RoBERTa selama kira-kira 15 hari untuk mencipta DarkBERT .

Aplikasi DarkBERT dalam keselamatan siber

Apakah DarkBERT?  Bolehkah AI membantu melawan ancaman siber?

DarkBERT mempunyai pemahaman yang lebih baik tentang bahasa penjenayah siber dan cemerlang dalam mengesan potensi ancaman tertentu. Ia boleh menyelidik web gelap dan berjaya mengenal pasti dan membenderakan ancaman keselamatan siber seperti kebocoran data dan perisian tebusan, menjadikannya alat yang berpotensi berguna untuk memerangi ancaman Dalam Talian.

Penyelidikan yang disiarkan di arxiv.org menunjukkan bahawa untuk menilai keberkesanan DarkBERT, penyelidik membandingkannya dengan dua model NLP terkenal, BERT dan RoBERTa, menilai prestasi mereka dalam tiga kes penggunaan. aplikasi penting yang berkaitan dengan keselamatan rangkaian.

1. Pantau forum Web Gelap untuk topik yang berpotensi berbahaya

Memantau forum web gelap, yang sering digunakan untuk pertukaran maklumat haram, adalah penting untuk mengenal pasti topik yang berpotensi berbahaya. Walau bagaimanapun, menyemak ini secara manual boleh memakan masa, menjadikan proses mengautomasikan bermanfaat untuk profesional keselamatan.

Penyelidik menumpukan pada aktiviti yang berpotensi berbahaya dalam forum penggodaman, menyediakan panduan beranotasi kepada topik penting, termasuk berkongsi data sulit dan mengedarkan perisian hasad. bahaya serius atau kerentanan.

DarkBERT mengatasi model bahasa lain dari segi ketepatan, ingatan semula dan skor F1, muncul sebagai pilihan unggul untuk mengenal pasti topik yang patut diberitakan di web gelap.

2. Kesan halaman yang menyimpan maklumat sulit

Penggodam dan kumpulan perisian tebusan menggunakan web gelap untuk mencipta tapak web bocor di mana mereka menerbitkan data sulit yang dicuri daripada organisasi yang enggan mematuhi tuntutan wang tebusan. Penjenayah siber lain hanya memuat naik data sensitif yang bocor, seperti kata laluan dan maklumat kewangan, ke web gelap dengan niat untuk menjualnya.

Dalam kajian mereka, para penyelidik mengumpul data daripada kumpulan ransomware yang terkenal dan menganalisis tapak web kebocoran ransomware yang menerbitkan data peribadi organisasi. DarkBERT mengatasi model bahasa lain dalam mengenal pasti dan mengklasifikasikan tapak sedemikian, menunjukkan pemahamannya tentang bahasa yang digunakan dalam forum penggodaman bawah tanah di web gelap.

3. Kenal pasti kata kunci yang berkaitan dengan ancaman di Web Gelap

Apakah DarkBERT?  Bolehkah AI membantu melawan ancaman siber?

DarkBERT memanfaatkan pengisian topeng, ciri yang wujud dalam model bahasa keluarga BERT, untuk mengenal pasti kata kunci yang berkaitan dengan aktiviti haram dengan tepat, termasuk penjualan dadah di sisi gelap. web.

Apabila perkataan "MDMA" disembunyikan pada halaman jualan dadah, DarkBERT menghasilkan perkataan berkaitan dadah, manakala model lain mencadangkan perkataan dan istilah bukan berkaitan dadah generik, seperti industri profesion yang berbeza.

Keupayaan DarkBERT untuk mengenal pasti kata kunci yang dikaitkan dengan aktiviti haram boleh menjadi berharga dalam menjejak dan menangani ancaman siber yang muncul.

Bolehkah orang ramai mengakses DarkBERT?

DarkBERT tidak tersedia untuk umum pada masa ini, tetapi penyelidik yang bersedia boleh meminta penggunaannya untuk tujuan akademik.


Pasukan petugas ChatGPT akan ditubuhkan oleh Eropah

Pasukan petugas ChatGPT akan ditubuhkan oleh Eropah

Badan yang menyatukan pemerhati privasi negara Eropah berkata pada hari Khamis ia telah menubuhkan pasukan petugas khusus untuk ChatGPT

AI meramalkan masa kematian manusia dengan ketepatan 78%.

AI meramalkan masa kematian manusia dengan ketepatan 78%.

Para saintis Denmark dan Amerika telah bekerjasama untuk membangunkan sistem AI yang dipanggil life2vec, yang mampu meramalkan masa kematian manusia dengan ketepatan yang tinggi.

AI meramalkan penyakit kencing hanya dengan bunyi air kencing

AI meramalkan penyakit kencing hanya dengan bunyi air kencing

Algoritma AI yang dipanggil Audioflow boleh mendengar bunyi kencing untuk mengenal pasti aliran tidak normal dan masalah kesihatan pesakit yang sepadan dengan berkesan dan berjaya.

Pelayan bar, berhati-hati: Robot ini boleh mencampurkan koktel dalam masa 1 minit sahaja

Pelayan bar, berhati-hati: Robot ini boleh mencampurkan koktel dalam masa 1 minit sahaja

Penduduk Jepun yang semakin tua dan semakin berkurangan menyebabkan negara itu kekurangan sejumlah besar pekerja muda, terutamanya dalam sektor perkhidmatan.

Beratus-ratus orang kecewa apabila mereka mengetahui bahawa gadis yang mereka cintai adalah produk AI

Beratus-ratus orang kecewa apabila mereka mengetahui bahawa gadis yang mereka cintai adalah produk AI

Pengguna Reddit bernama u/LegalBeagle1966 ialah salah satu daripada ramai pengguna yang terpikat dengan Claudia, seorang gadis seperti bintang filem yang sering berkongsi swafoto yang menggoda, malah bogel. di platform ini.

12 lagi syarikat berpotensi menyertai AI alliance Microsoft.

12 lagi syarikat berpotensi menyertai AI alliance Microsoft.

Microsoft baru sahaja mengumumkan bahawa 12 lagi syarikat teknologi akan mengambil bahagian dalam program AI for Goodnya.

AI mencipta semula watak Dragon Ball dalam daging dan darah

AI mencipta semula watak Dragon Ball dalam daging dan darah

Pengguna @mortecouille92 telah meletakkan kuasa alat reka bentuk grafik Midjourney untuk berfungsi dan mencipta versi unik realistik watak Dragon Ball yang terkenal seperti Goku, Vegeta, Bulma dan Kame yang lebih tua. .

7 teknik untuk meningkatkan respons ChatGPT

7 teknik untuk meningkatkan respons ChatGPT

Hanya dengan menambah beberapa syarat atau menyediakan beberapa senario, ChatGPT boleh memberikan jawapan yang lebih berkaitan kepada pertanyaan anda. Mari lihat beberapa cara anda boleh meningkatkan kualiti respons ChatGPT anda.

Kagum dengan lukisan cantik yang dilukis oleh kecerdasan buatan

Kagum dengan lukisan cantik yang dilukis oleh kecerdasan buatan

Midjourney ialah sistem kecerdasan buatan yang baru-baru ini menyebabkan "demam" dalam komuniti dalam talian dan dunia artis kerana lukisannya yang sangat cantik yang tidak kalah dengan lukisan artis sebenar.

Model AI ini adalah salah seorang pakar pertama yang menemui berita tentang wabak pneumonia Wuhan.

Model AI ini adalah salah seorang pakar pertama yang menemui berita tentang wabak pneumonia Wuhan.

Beberapa hari selepas China mengumumkan wabak itu, dengan akses kepada data jualan tiket penerbangan global, sistem AI BlueDot terus meramalkan dengan tepat penyebaran virus Wuhan Corona ke Bangkok, Seoul, Taipei dan Tokyo.