DarkBERT คืออะไร? AI สามารถช่วยต่อสู้กับภัยคุกคามทางไซเบอร์ได้หรือไม่?

ความนิยมของโมเดลภาษาขนาดใหญ่ (LLM) กำลังเพิ่มสูงขึ้น โดยมีโมเดลใหม่ๆ ปรากฏขึ้นอย่างต่อเนื่อง โดยทั่วไป โมเดลอย่างChatGPTจะได้รับการฝึกอบรมจากแหล่งข้อมูลทางอินเทอร์เน็ตที่หลากหลาย รวมถึงบทความ เว็บไซต์ หนังสือ และโซเชียลมีเดีย

ทีมนักวิจัยชาวเกาหลีพัฒนา DarkBERT ซึ่งเป็น LLM ที่ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่มาจากเว็บมืด โดย เฉพาะ เป้าหมายของพวกเขาคือการสร้างเครื่องมือ AI ที่มีประสิทธิภาพเหนือกว่าโมเดลภาษาที่มีอยู่และช่วยเหลือนักวิจัยด้านภัยคุกคาม การบังคับใช้กฎหมาย และผู้เชี่ยวชาญด้านความปลอดภัยทางไซเบอร์ในความพยายามของพวกเขา กับภัยคุกคามออนไลน์

DarkBERT คืออะไร?

DarkBERT คือโมเดลตัวเข้ารหัสที่ใช้สถาปัตยกรรม RoBERTa LLM ได้รับการฝึกอบรมเกี่ยวกับเว็บไซต์มืดหลายล้านแห่ง รวมถึงข้อมูลจากฟอรัมการแฮ็ก ไซต์ฟิชชิ่ง และแหล่งข้อมูลออนไลน์อื่น ๆ ที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมาย

คำว่า "เว็บมืด" หมายถึงส่วนที่ซ่อนอยู่ของอินเทอร์เน็ตซึ่งไม่สามารถเข้าถึงได้ผ่านเว็บเบราว์เซอร์มาตรฐาน อินเทอร์เน็ตส่วนนี้มีชื่อเสียงในด้านการเก็บซ่อนเว็บไซต์ที่ไม่เปิดเผยตัวตนและตลาดที่ผิดกฎหมาย เช่น การขายข้อมูลที่ขโมยมา ยาเสพติด และอาวุธ

เพื่อฝึก DarkBERT นักวิจัยสามารถเข้าถึงดาร์กเว็บผ่านเครือข่าย Tor และรวบรวมข้อมูลดิบ พวกเขากรองข้อมูลนี้อย่างระมัดระวังโดยใช้เทคนิคต่างๆ เช่น การขจัดข้อมูลซ้ำซ้อน การปรับสมดุลหมวดหมู่ และการประมวลผลล่วงหน้าเพื่อสร้างฐานข้อมูลดาร์กเว็บที่ได้รับการปรับแต่งอย่างละเอียด ซึ่งจากนั้นจะถูกป้อนให้กับ RoBERTa ในเวลาประมาณ 15 วันเพื่อสร้าง DarkBERT

แอปพลิเคชัน DarkBERT ในความปลอดภัยทางไซเบอร์

DarkBERT คืออะไร? AI สามารถช่วยต่อสู้กับภัยคุกคามทางไซเบอร์ได้หรือไม่?

DarkBERT มีความเข้าใจในภาษาของอาชญากรไซเบอร์เป็นอย่างดี และมีความเป็นเลิศในการตรวจจับภัยคุกคามที่อาจเกิดขึ้นโดยเฉพาะ สามารถค้นคว้าเว็บมืดและระบุและทำเครื่องหมายภัยคุกคามความปลอดภัยทางไซเบอร์ได้สำเร็จ เช่น ข้อมูลรั่วไหลและแรนซัมแวร์ ทำให้เป็นเครื่องมือที่มีประโยชน์ในการต่อสู้กับภัยคุกคามออนไลน์

การวิจัยที่โพสต์บน arxiv.org แสดงให้เห็นว่าเพื่อประเมินประสิทธิภาพของ DarkBERT นักวิจัยได้เปรียบเทียบกับโมเดล NLP ที่มีชื่อเสียงสองโมเดล ได้แก่ BERT และ RoBERTa โดยประเมินประสิทธิภาพในการใช้งานสามกรณี นั่นคือ แอปพลิเคชันที่สำคัญที่เกี่ยวข้องกับความปลอดภัยของเครือข่าย

1. ตรวจสอบฟอรัม Dark Web เพื่อหาหัวข้อที่อาจเป็นอันตราย

การตรวจสอบฟอรัมเว็บมืดซึ่งมักใช้สำหรับการแลกเปลี่ยนข้อมูลที่ผิดกฎหมายเป็นสิ่งสำคัญในการระบุหัวข้อที่อาจเป็นอันตราย อย่างไรก็ตาม การตรวจสอบสิ่งเหล่านี้ด้วยตนเองอาจใช้เวลานาน ทำให้กระบวนการอัตโนมัติเป็นประโยชน์ต่อผู้เชี่ยวชาญด้านความปลอดภัย

นักวิจัยมุ่งเน้นไปที่กิจกรรมที่อาจเป็นอันตรายในฟอรัมการแฮ็ก โดยให้คำแนะนำพร้อมคำอธิบายประกอบในหัวข้อที่น่าสนใจ รวมถึงการแบ่งปันข้อมูลที่เป็นความลับ และการแพร่กระจายมัลแวร์ อันตรายร้ายแรงหรือช่องโหว่

DarkBERT มีประสิทธิภาพเหนือกว่าโมเดลภาษาอื่นๆ ในแง่ของความแม่นยำ การเรียกคืน และคะแนน F1 ซึ่งกลายเป็นตัวเลือกที่เหนือกว่าสำหรับการระบุหัวข้อที่น่าสนใจในข่าวสารบนเว็บมืด

2. ตรวจจับเพจที่โฮสต์ข้อมูลที่เป็นความลับ

แฮกเกอร์และกลุ่มแรนซัมแวร์ใช้ดาร์กเว็บเพื่อสร้างเว็บไซต์รั่วไหล โดยที่พวกเขาเผยแพร่ข้อมูลที่เป็นความลับที่ถูกขโมยมาจากองค์กรที่ปฏิเสธที่จะปฏิบัติตามข้อเรียกร้องค่าไถ่ อาชญากรไซเบอร์อื่นๆ เพียงอัปโหลดข้อมูลที่ละเอียดอ่อนที่รั่วไหลออกมา เช่น รหัสผ่านและข้อมูลทางการเงิน ไปยังเว็บมืดโดยมีจุดประสงค์ที่จะขายมัน

ในการศึกษาของพวกเขา นักวิจัยได้รวบรวมข้อมูลจากกลุ่มแรนซัมแวร์ที่โด่งดัง และวิเคราะห์เว็บไซต์รั่วไหลของแรนซัมแวร์ที่เผยแพร่ข้อมูลส่วนตัวขององค์กร DarkBERT มีประสิทธิภาพเหนือกว่าโมเดลภาษาอื่นในการระบุและจำแนกไซต์ดังกล่าว แสดงให้เห็นถึงความเข้าใจภาษาที่ใช้ในฟอรัมแฮ็กใต้ดินบนเว็บที่มืด

3. ระบุคำหลักที่เกี่ยวข้องกับภัยคุกคามบน Dark Web

DarkBERT คืออะไร? AI สามารถช่วยต่อสู้กับภัยคุกคามทางไซเบอร์ได้หรือไม่?

DarkBERT ใช้ประโยชน์จากการเติมหน้ากากซึ่งเป็นคุณลักษณะที่มีอยู่ในโมเดลภาษาตระกูล BERT เพื่อระบุคำหลักที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมายได้อย่างแม่นยำ รวมถึงการขายยาในด้านมืด เว็บ

เมื่อคำว่า "MDMA" ถูกซ่อนอยู่ในหน้าขายยา DarkBERT ได้สร้างคำที่เกี่ยวข้องกับยา ในขณะที่โมเดลอื่นๆ แนะนำคำและคำศัพท์ทั่วไปที่ไม่เกี่ยวข้องกับยาเสพติด เช่น อุตสาหกรรมต่างๆ วิชาชีพ

ความสามารถของ DarkBERT ในการระบุคำหลักที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมายสามารถมีคุณค่าในการติดตามและจัดการกับภัยคุกคามทางไซเบอร์ที่เกิดขึ้นใหม่

สาธารณะสามารถเข้าถึง DarkBERT ได้หรือไม่?

ขณะนี้ DarkBERT ยังไม่เปิดให้บริการแก่สาธารณะ แต่นักวิจัยที่เต็มใจสามารถขอใช้เพื่อวัตถุประสงค์ทางวิชาการได้

ฝากความเห็น

6 วิธีในการเปิด Device Manager บน Windows 10

วิธีเปิดตัวจัดการอุปกรณ์ใน Windows 10 โดยง่าย

GPT4All คืออะไร? GPT4All ทำงานอย่างไร

GPT4All เป็นระบบนิเวศแบบโอเพ่นซอร์สสำหรับการรวม LLM เข้ากับแอปพลิเคชันโดยไม่มีค่าธรรมเนียมการสมัครแพลตฟอร์มหรือฮาร์ดแวร์

คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

หน่วยงานที่รวบรวมหน่วยงานเฝ้าระวังความเป็นส่วนตัวระดับชาติของยุโรป ระบุเมื่อวันพฤหัสบดีว่า ได้จัดตั้งคณะทำงานเฉพาะกิจเพื่อ ChatGPT

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

นักวิทยาศาสตร์ชาวเดนมาร์กและชาวอเมริกันได้ร่วมมือกันพัฒนาระบบ AI ที่เรียกว่า life2vec ซึ่งสามารถทำนายเวลาการตายของมนุษย์ได้อย่างแม่นยำสูง

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

อัลกอริธึม AI ที่เรียกว่า Audioflow สามารถฟังเสียงปัสสาวะเพื่อระบุการไหลที่ผิดปกติและปัญหาสุขภาพที่เกี่ยวข้องของผู้ป่วยได้อย่างมีประสิทธิภาพและประสบความสำเร็จ

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

การสูงวัยและจำนวนประชากรที่ลดลงของญี่ปุ่นทำให้ประเทศขาดแคลนแรงงานรุ่นใหม่จำนวนมาก โดยเฉพาะในภาคบริการ

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้ใช้ Reddit ชื่อ u/LegalBeagle1966 เป็นหนึ่งในผู้ใช้จำนวนมากที่หลงรัก Claudia เด็กสาวที่เหมือนดาราภาพยนตร์ที่มักจะแชร์ภาพเซลฟี่ที่เย้ายวนใจ แม้กระทั่งภาพเปลือย บนแพลตฟอร์มนี้

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

Microsoft เพิ่งประกาศว่าบริษัทเทคโนโลยีอีก 12 แห่งจะเข้าร่วมในโครงการ AI for Good

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

ผู้ใช้ @mortecouille92 ได้นำพลังของเครื่องมือออกแบบกราฟิก Midjourney มาใช้งาน และสร้างตัวละคร Dragon Ball อันโด่งดังในเวอร์ชันสมจริงที่ไม่เหมือนใคร เช่น Goku, Vegeta, Bulma และพี่ Kame

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

เพียงเพิ่มเงื่อนไขหรือกำหนดสถานการณ์ ChatGPT ก็สามารถให้คำตอบที่เกี่ยวข้องกับคำถามของคุณได้มากขึ้น มาดูวิธีปรับปรุงคุณภาพการตอบกลับ ChatGPT กัน