DarkBERT คืออะไร? AI สามารถช่วยต่อสู้กับภัยคุกคามทางไซเบอร์ได้หรือไม่?

DarkBERT คืออะไร? AI สามารถช่วยต่อสู้กับภัยคุกคามทางไซเบอร์ได้หรือไม่?

ความนิยมของโมเดลภาษาขนาดใหญ่ (LLM) กำลังเพิ่มสูงขึ้น โดยมีโมเดลใหม่ๆ ปรากฏขึ้นอย่างต่อเนื่อง โดยทั่วไป โมเดลอย่างChatGPTจะได้รับการฝึกอบรมจากแหล่งข้อมูลทางอินเทอร์เน็ตที่หลากหลาย รวมถึงบทความ เว็บไซต์ หนังสือ และโซเชียลมีเดีย

ทีมนักวิจัยชาวเกาหลีพัฒนา DarkBERT ซึ่งเป็น LLM ที่ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่มาจากเว็บมืด โดย เฉพาะ เป้าหมายของพวกเขาคือการสร้างเครื่องมือ AI ที่มีประสิทธิภาพเหนือกว่าโมเดลภาษาที่มีอยู่และช่วยเหลือนักวิจัยด้านภัยคุกคาม การบังคับใช้กฎหมาย และผู้เชี่ยวชาญด้านความปลอดภัยทางไซเบอร์ในความพยายามของพวกเขา กับภัยคุกคามออนไลน์

DarkBERT คืออะไร?

DarkBERT คือโมเดลตัวเข้ารหัสที่ใช้สถาปัตยกรรม RoBERTa LLM ได้รับการฝึกอบรมเกี่ยวกับเว็บไซต์มืดหลายล้านแห่ง รวมถึงข้อมูลจากฟอรัมการแฮ็ก ไซต์ฟิชชิ่ง และแหล่งข้อมูลออนไลน์อื่น ๆ ที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมาย

คำว่า "เว็บมืด" หมายถึงส่วนที่ซ่อนอยู่ของอินเทอร์เน็ตซึ่งไม่สามารถเข้าถึงได้ผ่านเว็บเบราว์เซอร์มาตรฐาน อินเทอร์เน็ตส่วนนี้มีชื่อเสียงในด้านการเก็บซ่อนเว็บไซต์ที่ไม่เปิดเผยตัวตนและตลาดที่ผิดกฎหมาย เช่น การขายข้อมูลที่ขโมยมา ยาเสพติด และอาวุธ

เพื่อฝึก DarkBERT นักวิจัยสามารถเข้าถึงดาร์กเว็บผ่านเครือข่าย Tor และรวบรวมข้อมูลดิบ พวกเขากรองข้อมูลนี้อย่างระมัดระวังโดยใช้เทคนิคต่างๆ เช่น การขจัดข้อมูลซ้ำซ้อน การปรับสมดุลหมวดหมู่ และการประมวลผลล่วงหน้าเพื่อสร้างฐานข้อมูลดาร์กเว็บที่ได้รับการปรับแต่งอย่างละเอียด ซึ่งจากนั้นจะถูกป้อนให้กับ RoBERTa ในเวลาประมาณ 15 วันเพื่อสร้าง DarkBERT

แอปพลิเคชัน DarkBERT ในความปลอดภัยทางไซเบอร์

DarkBERT คืออะไร?  AI สามารถช่วยต่อสู้กับภัยคุกคามทางไซเบอร์ได้หรือไม่?

DarkBERT มีความเข้าใจในภาษาของอาชญากรไซเบอร์เป็นอย่างดี และมีความเป็นเลิศในการตรวจจับภัยคุกคามที่อาจเกิดขึ้นโดยเฉพาะ สามารถค้นคว้าเว็บมืดและระบุและทำเครื่องหมายภัยคุกคามความปลอดภัยทางไซเบอร์ได้สำเร็จ เช่น ข้อมูลรั่วไหลและแรนซัมแวร์ ทำให้เป็นเครื่องมือที่มีประโยชน์ในการต่อสู้กับภัยคุกคามออนไลน์

การวิจัยที่โพสต์บน arxiv.org แสดงให้เห็นว่าเพื่อประเมินประสิทธิภาพของ DarkBERT นักวิจัยได้เปรียบเทียบกับโมเดล NLP ที่มีชื่อเสียงสองโมเดล ได้แก่ BERT และ RoBERTa โดยประเมินประสิทธิภาพในการใช้งานสามกรณี นั่นคือ แอปพลิเคชันที่สำคัญที่เกี่ยวข้องกับความปลอดภัยของเครือข่าย

1. ตรวจสอบฟอรัม Dark Web เพื่อหาหัวข้อที่อาจเป็นอันตราย

การตรวจสอบฟอรัมเว็บมืดซึ่งมักใช้สำหรับการแลกเปลี่ยนข้อมูลที่ผิดกฎหมายเป็นสิ่งสำคัญในการระบุหัวข้อที่อาจเป็นอันตราย อย่างไรก็ตาม การตรวจสอบสิ่งเหล่านี้ด้วยตนเองอาจใช้เวลานาน ทำให้กระบวนการอัตโนมัติเป็นประโยชน์ต่อผู้เชี่ยวชาญด้านความปลอดภัย

นักวิจัยมุ่งเน้นไปที่กิจกรรมที่อาจเป็นอันตรายในฟอรัมการแฮ็ก โดยให้คำแนะนำพร้อมคำอธิบายประกอบในหัวข้อที่น่าสนใจ รวมถึงการแบ่งปันข้อมูลที่เป็นความลับ และการแพร่กระจายมัลแวร์ อันตรายร้ายแรงหรือช่องโหว่

DarkBERT มีประสิทธิภาพเหนือกว่าโมเดลภาษาอื่นๆ ในแง่ของความแม่นยำ การเรียกคืน และคะแนน F1 ซึ่งกลายเป็นตัวเลือกที่เหนือกว่าสำหรับการระบุหัวข้อที่น่าสนใจในข่าวสารบนเว็บมืด

2. ตรวจจับเพจที่โฮสต์ข้อมูลที่เป็นความลับ

แฮกเกอร์และกลุ่มแรนซัมแวร์ใช้ดาร์กเว็บเพื่อสร้างเว็บไซต์รั่วไหล โดยที่พวกเขาเผยแพร่ข้อมูลที่เป็นความลับที่ถูกขโมยมาจากองค์กรที่ปฏิเสธที่จะปฏิบัติตามข้อเรียกร้องค่าไถ่ อาชญากรไซเบอร์อื่นๆ เพียงอัปโหลดข้อมูลที่ละเอียดอ่อนที่รั่วไหลออกมา เช่น รหัสผ่านและข้อมูลทางการเงิน ไปยังเว็บมืดโดยมีจุดประสงค์ที่จะขายมัน

ในการศึกษาของพวกเขา นักวิจัยได้รวบรวมข้อมูลจากกลุ่มแรนซัมแวร์ที่โด่งดัง และวิเคราะห์เว็บไซต์รั่วไหลของแรนซัมแวร์ที่เผยแพร่ข้อมูลส่วนตัวขององค์กร DarkBERT มีประสิทธิภาพเหนือกว่าโมเดลภาษาอื่นในการระบุและจำแนกไซต์ดังกล่าว แสดงให้เห็นถึงความเข้าใจภาษาที่ใช้ในฟอรัมแฮ็กใต้ดินบนเว็บที่มืด

3. ระบุคำหลักที่เกี่ยวข้องกับภัยคุกคามบน Dark Web

DarkBERT คืออะไร?  AI สามารถช่วยต่อสู้กับภัยคุกคามทางไซเบอร์ได้หรือไม่?

DarkBERT ใช้ประโยชน์จากการเติมหน้ากากซึ่งเป็นคุณลักษณะที่มีอยู่ในโมเดลภาษาตระกูล BERT เพื่อระบุคำหลักที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมายได้อย่างแม่นยำ รวมถึงการขายยาในด้านมืด เว็บ

เมื่อคำว่า "MDMA" ถูกซ่อนอยู่ในหน้าขายยา DarkBERT ได้สร้างคำที่เกี่ยวข้องกับยา ในขณะที่โมเดลอื่นๆ แนะนำคำและคำศัพท์ทั่วไปที่ไม่เกี่ยวข้องกับยาเสพติด เช่น อุตสาหกรรมต่างๆ วิชาชีพ

ความสามารถของ DarkBERT ในการระบุคำหลักที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมายสามารถมีคุณค่าในการติดตามและจัดการกับภัยคุกคามทางไซเบอร์ที่เกิดขึ้นใหม่

สาธารณะสามารถเข้าถึง DarkBERT ได้หรือไม่?

ขณะนี้ DarkBERT ยังไม่เปิดให้บริการแก่สาธารณะ แต่นักวิจัยที่เต็มใจสามารถขอใช้เพื่อวัตถุประสงค์ทางวิชาการได้


คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป

หน่วยงานที่รวบรวมหน่วยงานเฝ้าระวังความเป็นส่วนตัวระดับชาติของยุโรป ระบุเมื่อวันพฤหัสบดีว่า ได้จัดตั้งคณะทำงานเฉพาะกิจเพื่อ ChatGPT

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

AI ทำนายเวลาการตายของมนุษย์ด้วยความแม่นยำ 78%

นักวิทยาศาสตร์ชาวเดนมาร์กและชาวอเมริกันได้ร่วมมือกันพัฒนาระบบ AI ที่เรียกว่า life2vec ซึ่งสามารถทำนายเวลาการตายของมนุษย์ได้อย่างแม่นยำสูง

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

AI ทำนายโรคทางเดินปัสสาวะด้วยเสียงปัสสาวะ

อัลกอริธึม AI ที่เรียกว่า Audioflow สามารถฟังเสียงปัสสาวะเพื่อระบุการไหลที่ผิดปกติและปัญหาสุขภาพที่เกี่ยวข้องของผู้ป่วยได้อย่างมีประสิทธิภาพและประสบความสำเร็จ

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

บาร์เทนเดอร์ระวัง: หุ่นยนต์ตัวนี้สามารถผสมค็อกเทลได้ภายในเวลาเพียง 1 นาที

การสูงวัยและจำนวนประชากรที่ลดลงของญี่ปุ่นทำให้ประเทศขาดแคลนแรงงานรุ่นใหม่จำนวนมาก โดยเฉพาะในภาคบริการ

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้คนหลายร้อยคนไม่แยแสเมื่อรู้ว่าผู้หญิงที่พวกเขารักเป็นผลมาจาก AI

ผู้ใช้ Reddit ชื่อ u/LegalBeagle1966 เป็นหนึ่งในผู้ใช้จำนวนมากที่หลงรัก Claudia เด็กสาวที่เหมือนดาราภาพยนตร์ที่มักจะแชร์ภาพเซลฟี่ที่เย้ายวนใจ แม้กระทั่งภาพเปลือย บนแพลตฟอร์มนี้

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

บริษัทที่มีศักยภาพอีก 12 แห่งเข้าร่วม พันธมิตร AI ของ Microsoft

Microsoft เพิ่งประกาศว่าบริษัทเทคโนโลยีอีก 12 แห่งจะเข้าร่วมในโครงการ AI for Good

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

AI สร้างตัวละคร Dragon Ball ขึ้นมาใหม่ทั้งเนื้อและเลือด

ผู้ใช้ @mortecouille92 ได้นำพลังของเครื่องมือออกแบบกราฟิก Midjourney มาใช้งาน และสร้างตัวละคร Dragon Ball อันโด่งดังในเวอร์ชันสมจริงที่ไม่เหมือนใคร เช่น Goku, Vegeta, Bulma และพี่ Kame

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

7 เทคนิคในการปรับปรุงการตอบสนอง ChatGPT

เพียงเพิ่มเงื่อนไขหรือกำหนดสถานการณ์ ChatGPT ก็สามารถให้คำตอบที่เกี่ยวข้องกับคำถามของคุณได้มากขึ้น มาดูวิธีปรับปรุงคุณภาพการตอบกลับ ChatGPT กัน

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

ตื่นตาตื่นใจกับภาพวาดที่สวยงามซึ่งวาดโดยปัญญาประดิษฐ์

Midjourney คือระบบปัญญาประดิษฐ์ที่เพิ่งทำให้เกิด "กระแส" ขึ้นในชุมชนออนไลน์และโลกของศิลปิน เนื่องจากมีภาพวาดที่สวยงามอย่างยิ่งที่ไม่ด้อยไปกว่าภาพวาดของศิลปินตัวจริง

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

แบบจำลอง AI นี้เป็นหนึ่งใน ผู้เชี่ยวชาญ คนแรก ๆ ที่ค้นพบข่าวเกี่ยวกับการระบาดของโรคปอดบวมในหวู่ฮั่น

ไม่กี่วันหลังจากที่จีนประกาศการระบาด ด้วยการเข้าถึงข้อมูลการขายตั๋วเครื่องบินทั่วโลก ระบบ AI ของ BlueDot ยังคงคาดการณ์การแพร่กระจายของไวรัสโคโรน่าหวู่ฮั่นไปยังกรุงเทพฯ โซล ไทเป และโตเกียวได้อย่างแม่นยำ