คณะทำงานเฉพาะกิจ ChatGPT จะถูกจัดตั้งขึ้นโดยยุโรป
หน่วยงานที่รวบรวมหน่วยงานเฝ้าระวังความเป็นส่วนตัวระดับชาติของยุโรป ระบุเมื่อวันพฤหัสบดีว่า ได้จัดตั้งคณะทำงานเฉพาะกิจเพื่อ ChatGPT
ความนิยมของโมเดลภาษาขนาดใหญ่ (LLM) กำลังเพิ่มสูงขึ้น โดยมีโมเดลใหม่ๆ ปรากฏขึ้นอย่างต่อเนื่อง โดยทั่วไป โมเดลอย่างChatGPTจะได้รับการฝึกอบรมจากแหล่งข้อมูลทางอินเทอร์เน็ตที่หลากหลาย รวมถึงบทความ เว็บไซต์ หนังสือ และโซเชียลมีเดีย
ทีมนักวิจัยชาวเกาหลีพัฒนา DarkBERT ซึ่งเป็น LLM ที่ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่มาจากเว็บมืด โดย เฉพาะ เป้าหมายของพวกเขาคือการสร้างเครื่องมือ AI ที่มีประสิทธิภาพเหนือกว่าโมเดลภาษาที่มีอยู่และช่วยเหลือนักวิจัยด้านภัยคุกคาม การบังคับใช้กฎหมาย และผู้เชี่ยวชาญด้านความปลอดภัยทางไซเบอร์ในความพยายามของพวกเขา กับภัยคุกคามออนไลน์
DarkBERT คืออะไร?
DarkBERT คือโมเดลตัวเข้ารหัสที่ใช้สถาปัตยกรรม RoBERTa LLM ได้รับการฝึกอบรมเกี่ยวกับเว็บไซต์มืดหลายล้านแห่ง รวมถึงข้อมูลจากฟอรัมการแฮ็ก ไซต์ฟิชชิ่ง และแหล่งข้อมูลออนไลน์อื่น ๆ ที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมาย
คำว่า "เว็บมืด" หมายถึงส่วนที่ซ่อนอยู่ของอินเทอร์เน็ตซึ่งไม่สามารถเข้าถึงได้ผ่านเว็บเบราว์เซอร์มาตรฐาน อินเทอร์เน็ตส่วนนี้มีชื่อเสียงในด้านการเก็บซ่อนเว็บไซต์ที่ไม่เปิดเผยตัวตนและตลาดที่ผิดกฎหมาย เช่น การขายข้อมูลที่ขโมยมา ยาเสพติด และอาวุธ
เพื่อฝึก DarkBERT นักวิจัยสามารถเข้าถึงดาร์กเว็บผ่านเครือข่าย Tor และรวบรวมข้อมูลดิบ พวกเขากรองข้อมูลนี้อย่างระมัดระวังโดยใช้เทคนิคต่างๆ เช่น การขจัดข้อมูลซ้ำซ้อน การปรับสมดุลหมวดหมู่ และการประมวลผลล่วงหน้าเพื่อสร้างฐานข้อมูลดาร์กเว็บที่ได้รับการปรับแต่งอย่างละเอียด ซึ่งจากนั้นจะถูกป้อนให้กับ RoBERTa ในเวลาประมาณ 15 วันเพื่อสร้าง DarkBERT
แอปพลิเคชัน DarkBERT ในความปลอดภัยทางไซเบอร์
DarkBERT มีความเข้าใจในภาษาของอาชญากรไซเบอร์เป็นอย่างดี และมีความเป็นเลิศในการตรวจจับภัยคุกคามที่อาจเกิดขึ้นโดยเฉพาะ สามารถค้นคว้าเว็บมืดและระบุและทำเครื่องหมายภัยคุกคามความปลอดภัยทางไซเบอร์ได้สำเร็จ เช่น ข้อมูลรั่วไหลและแรนซัมแวร์ ทำให้เป็นเครื่องมือที่มีประโยชน์ในการต่อสู้กับภัยคุกคามออนไลน์
การวิจัยที่โพสต์บน arxiv.org แสดงให้เห็นว่าเพื่อประเมินประสิทธิภาพของ DarkBERT นักวิจัยได้เปรียบเทียบกับโมเดล NLP ที่มีชื่อเสียงสองโมเดล ได้แก่ BERT และ RoBERTa โดยประเมินประสิทธิภาพในการใช้งานสามกรณี นั่นคือ แอปพลิเคชันที่สำคัญที่เกี่ยวข้องกับความปลอดภัยของเครือข่าย
1. ตรวจสอบฟอรัม Dark Web เพื่อหาหัวข้อที่อาจเป็นอันตราย
การตรวจสอบฟอรัมเว็บมืดซึ่งมักใช้สำหรับการแลกเปลี่ยนข้อมูลที่ผิดกฎหมายเป็นสิ่งสำคัญในการระบุหัวข้อที่อาจเป็นอันตราย อย่างไรก็ตาม การตรวจสอบสิ่งเหล่านี้ด้วยตนเองอาจใช้เวลานาน ทำให้กระบวนการอัตโนมัติเป็นประโยชน์ต่อผู้เชี่ยวชาญด้านความปลอดภัย
นักวิจัยมุ่งเน้นไปที่กิจกรรมที่อาจเป็นอันตรายในฟอรัมการแฮ็ก โดยให้คำแนะนำพร้อมคำอธิบายประกอบในหัวข้อที่น่าสนใจ รวมถึงการแบ่งปันข้อมูลที่เป็นความลับ และการแพร่กระจายมัลแวร์ อันตรายร้ายแรงหรือช่องโหว่
DarkBERT มีประสิทธิภาพเหนือกว่าโมเดลภาษาอื่นๆ ในแง่ของความแม่นยำ การเรียกคืน และคะแนน F1 ซึ่งกลายเป็นตัวเลือกที่เหนือกว่าสำหรับการระบุหัวข้อที่น่าสนใจในข่าวสารบนเว็บมืด
2. ตรวจจับเพจที่โฮสต์ข้อมูลที่เป็นความลับ
แฮกเกอร์และกลุ่มแรนซัมแวร์ใช้ดาร์กเว็บเพื่อสร้างเว็บไซต์รั่วไหล โดยที่พวกเขาเผยแพร่ข้อมูลที่เป็นความลับที่ถูกขโมยมาจากองค์กรที่ปฏิเสธที่จะปฏิบัติตามข้อเรียกร้องค่าไถ่ อาชญากรไซเบอร์อื่นๆ เพียงอัปโหลดข้อมูลที่ละเอียดอ่อนที่รั่วไหลออกมา เช่น รหัสผ่านและข้อมูลทางการเงิน ไปยังเว็บมืดโดยมีจุดประสงค์ที่จะขายมัน
ในการศึกษาของพวกเขา นักวิจัยได้รวบรวมข้อมูลจากกลุ่มแรนซัมแวร์ที่โด่งดัง และวิเคราะห์เว็บไซต์รั่วไหลของแรนซัมแวร์ที่เผยแพร่ข้อมูลส่วนตัวขององค์กร DarkBERT มีประสิทธิภาพเหนือกว่าโมเดลภาษาอื่นในการระบุและจำแนกไซต์ดังกล่าว แสดงให้เห็นถึงความเข้าใจภาษาที่ใช้ในฟอรัมแฮ็กใต้ดินบนเว็บที่มืด
3. ระบุคำหลักที่เกี่ยวข้องกับภัยคุกคามบน Dark Web
DarkBERT ใช้ประโยชน์จากการเติมหน้ากากซึ่งเป็นคุณลักษณะที่มีอยู่ในโมเดลภาษาตระกูล BERT เพื่อระบุคำหลักที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมายได้อย่างแม่นยำ รวมถึงการขายยาในด้านมืด เว็บ
เมื่อคำว่า "MDMA" ถูกซ่อนอยู่ในหน้าขายยา DarkBERT ได้สร้างคำที่เกี่ยวข้องกับยา ในขณะที่โมเดลอื่นๆ แนะนำคำและคำศัพท์ทั่วไปที่ไม่เกี่ยวข้องกับยาเสพติด เช่น อุตสาหกรรมต่างๆ วิชาชีพ
ความสามารถของ DarkBERT ในการระบุคำหลักที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมายสามารถมีคุณค่าในการติดตามและจัดการกับภัยคุกคามทางไซเบอร์ที่เกิดขึ้นใหม่
สาธารณะสามารถเข้าถึง DarkBERT ได้หรือไม่?
ขณะนี้ DarkBERT ยังไม่เปิดให้บริการแก่สาธารณะ แต่นักวิจัยที่เต็มใจสามารถขอใช้เพื่อวัตถุประสงค์ทางวิชาการได้
หน่วยงานที่รวบรวมหน่วยงานเฝ้าระวังความเป็นส่วนตัวระดับชาติของยุโรป ระบุเมื่อวันพฤหัสบดีว่า ได้จัดตั้งคณะทำงานเฉพาะกิจเพื่อ ChatGPT
นักวิทยาศาสตร์ชาวเดนมาร์กและชาวอเมริกันได้ร่วมมือกันพัฒนาระบบ AI ที่เรียกว่า life2vec ซึ่งสามารถทำนายเวลาการตายของมนุษย์ได้อย่างแม่นยำสูง
อัลกอริธึม AI ที่เรียกว่า Audioflow สามารถฟังเสียงปัสสาวะเพื่อระบุการไหลที่ผิดปกติและปัญหาสุขภาพที่เกี่ยวข้องของผู้ป่วยได้อย่างมีประสิทธิภาพและประสบความสำเร็จ
การสูงวัยและจำนวนประชากรที่ลดลงของญี่ปุ่นทำให้ประเทศขาดแคลนแรงงานรุ่นใหม่จำนวนมาก โดยเฉพาะในภาคบริการ
ผู้ใช้ Reddit ชื่อ u/LegalBeagle1966 เป็นหนึ่งในผู้ใช้จำนวนมากที่หลงรัก Claudia เด็กสาวที่เหมือนดาราภาพยนตร์ที่มักจะแชร์ภาพเซลฟี่ที่เย้ายวนใจ แม้กระทั่งภาพเปลือย บนแพลตฟอร์มนี้
Microsoft เพิ่งประกาศว่าบริษัทเทคโนโลยีอีก 12 แห่งจะเข้าร่วมในโครงการ AI for Good
ผู้ใช้ @mortecouille92 ได้นำพลังของเครื่องมือออกแบบกราฟิก Midjourney มาใช้งาน และสร้างตัวละคร Dragon Ball อันโด่งดังในเวอร์ชันสมจริงที่ไม่เหมือนใคร เช่น Goku, Vegeta, Bulma และพี่ Kame
เพียงเพิ่มเงื่อนไขหรือกำหนดสถานการณ์ ChatGPT ก็สามารถให้คำตอบที่เกี่ยวข้องกับคำถามของคุณได้มากขึ้น มาดูวิธีปรับปรุงคุณภาพการตอบกลับ ChatGPT กัน
Midjourney คือระบบปัญญาประดิษฐ์ที่เพิ่งทำให้เกิด "กระแส" ขึ้นในชุมชนออนไลน์และโลกของศิลปิน เนื่องจากมีภาพวาดที่สวยงามอย่างยิ่งที่ไม่ด้อยไปกว่าภาพวาดของศิลปินตัวจริง
ไม่กี่วันหลังจากที่จีนประกาศการระบาด ด้วยการเข้าถึงข้อมูลการขายตั๋วเครื่องบินทั่วโลก ระบบ AI ของ BlueDot ยังคงคาดการณ์การแพร่กระจายของไวรัสโคโรน่าหวู่ฮั่นไปยังกรุงเทพฯ โซล ไทเป และโตเกียวได้อย่างแม่นยำ