ما هو داركبيرت؟ هل يمكن للذكاء الاصطناعي المساعدة في مكافحة التهديدات السيبرانية؟

تتزايد شعبية نماذج اللغات الكبيرة (LLMs) بشكل كبير، مع ظهور نماذج جديدة باستمرار. عادةً ما يتم تدريب النماذج مثل ChatGPT على مجموعة متنوعة من مصادر الإنترنت، بما في ذلك المقالات ومواقع الويب والكتب ووسائل التواصل الاجتماعي.

قام فريق من الباحثين الكوريين بتطوير DarkBERT، وهو ماجستير في القانون تم تدريبه على مجموعات البيانات التي يتم الحصول عليها حصريًا من الويب المظلم . هدفهم هو إنشاء أداة ذكاء اصطناعي تتفوق في الأداء على نماذج اللغة الحالية وتساعد الباحثين في مجال التهديدات وإنفاذ القانون ومتخصصي الأمن السيبراني في جهودهم ضد التهديدات عبر الإنترنت.

ما هو داركبيرت؟

DarkBERT هو نموذج تشفير يعتمد على بنية RoBERTa. تم تدريب LLM على الملايين من مواقع الويب المظلمة، بما في ذلك البيانات من منتديات القرصنة ومواقع التصيد الاحتيالي وغيرها من المصادر عبر الإنترنت المشاركة في أنشطة غير قانونية.

يشير مصطلح "الويب المظلم" إلى جزء مخفي من الإنترنت لا يمكن الوصول إليه من خلال متصفحات الويب القياسية. يشتهر هذا الجزء من الإنترنت بإيواء مواقع مجهولة المصدر وأسواق غير قانونية، مثل بيع البيانات المسروقة والمخدرات والأسلحة.

لتدريب DarkBERT، تمكن الباحثون من الوصول إلى الويب المظلم من خلال شبكة Tor وقاموا بجمع البيانات الأولية. لقد قاموا بتصفية هذه البيانات بعناية باستخدام تقنيات مثل إلغاء البيانات المكررة وموازنة الفئات والمعالجة المسبقة لإنشاء قاعدة بيانات دقيقة للويب المظلم، والتي تم تغذيتها بعد ذلك إلى RoBERTa على مدار 15 يومًا تقريبًا لإنشاء DarkBERT.

تطبيقات DarkBERT في الأمن السيبراني

ما هو داركبيرت؟ هل يمكن للذكاء الاصطناعي المساعدة في مكافحة التهديدات السيبرانية؟

يتمتع DarkBERT بفهم فائق للغة مجرمي الإنترنت ويتفوق في اكتشاف تهديدات محتملة محددة. يمكنه البحث في الويب المظلم والتعرف بنجاح على تهديدات الأمن السيبراني والإبلاغ عنها مثل تسرب البيانات وبرامج الفدية، مما يجعلها أداة مفيدة محتملة لمكافحة التهديدات عبر الإنترنت.

تظهر الأبحاث المنشورة على موقع arxiv.org أنه لتقييم فعالية DarkBERT، قام الباحثون بمقارنتها مع نموذجين مشهورين لمعالجة اللغات الطبيعية، BERT وRoBERTa، حيث قاموا بتقييم أدائهما عبر ثلاث حالات استخدام لتطبيقات مهمة تتعلق بأمن الشبكات.

1. مراقبة منتديات الويب المظلم بحثًا عن المواضيع التي قد تكون ضارة

تعد مراقبة منتديات الويب المظلمة، التي تُستخدم غالبًا لتبادل المعلومات غير القانوني، أمرًا مهمًا لتحديد الموضوعات التي يحتمل أن تكون خطيرة. ومع ذلك، قد تستغرق مراجعة هذه الأمور يدويًا وقتًا طويلاً، مما يجعل أتمتة العملية مفيدة لمحترفي الأمان.

ركز الباحثون على الأنشطة الضارة المحتملة في منتديات القرصنة، وقدموا أدلة مشروحة للموضوعات البارزة، بما في ذلك مشاركة البيانات السرية وتوزيع البرامج الضارة الخطيرة أو نقاط الضعف.

يتفوق DarkBERT على نماذج اللغات الأخرى من حيث الدقة والتذكر ودرجة F1، حيث يظهر كخيار متميز لتحديد الموضوعات الجديرة بالنشر على الويب المظلم.

2. كشف الصفحات التي تستضيف معلومات سرية

يستخدم المتسللون ومجموعات برامج الفدية شبكة الإنترنت المظلمة لإنشاء مواقع تسريب حيث ينشرون البيانات السرية المسروقة من المنظمات التي ترفض الامتثال لطلبات الفدية. يقوم مجرمو الإنترنت الآخرون ببساطة بتحميل البيانات الحساسة المسربة، مثل كلمات المرور والمعلومات المالية، إلى الويب المظلم بهدف بيعها.

في دراستهم، جمع الباحثون بيانات من مجموعات برامج الفدية سيئة السمعة وقاموا بتحليل مواقع تسرب برامج الفدية التي تنشر بيانات خاصة للمؤسسات. تتفوق DarkBERT على نماذج اللغات الأخرى في تحديد وتصنيف مثل هذه المواقع، مما يدل على فهمها للغة المستخدمة في منتديات القرصنة السرية على الويب المظلم.

3. تحديد الكلمات الرئيسية المتعلقة بالتهديدات على الويب المظلم

ما هو داركبيرت؟ هل يمكن للذكاء الاصطناعي المساعدة في مكافحة التهديدات السيبرانية؟

يستفيد DarkBERT من ملء القناع، وهي ميزة متأصلة في نماذج لغة عائلة BERT، لتحديد الكلمات الرئيسية المتعلقة بالأنشطة غير القانونية بدقة، بما في ذلك مبيعات المخدرات على الجانب المظلم من الويب.

عندما تم إخفاء كلمة "MDMA" في صفحة مبيعات الأدوية، قام DarkBERT بإنشاء كلمات متعلقة بالمخدرات، بينما اقترحت النماذج الأخرى كلمات ومصطلحات عامة غير متعلقة بالمخدرات، مثل الصناعات والمهن المختلفة.

يمكن أن تكون قدرة DarkBERT على تحديد الكلمات الرئيسية المرتبطة بالأنشطة غير القانونية ذات قيمة في تتبع التهديدات السيبرانية الناشئة ومعالجتها.

هل يستطيع الجمهور الوصول إلى DarkBERT؟

DarkBERT غير متاح حاليًا للعامة، ولكن يمكن للباحثين الراغبين في طلب استخدامه للأغراض الأكاديمية.

اترك تعليقاً

سيتم إنشاء فريق عمل ChatGPT من قبل أوروبا

وقالت الهيئة التي توحد هيئات مراقبة الخصوصية الوطنية في أوروبا يوم الخميس إنها أنشأت فريق عمل مخصص لـ ChatGPT

يتنبأ الذكاء الاصطناعي بوقت وفاة الإنسان بدقة تصل إلى 78%

تعاون علماء دنماركيون وأمريكيون لتطوير نظام ذكاء اصطناعي يسمى life2vec، قادر على التنبؤ بوقت وفاة الإنسان بدقة عالية.

يتنبأ الذكاء الاصطناعي بأمراض المسالك البولية بمجرد صوت البول

يمكن لخوارزمية الذكاء الاصطناعي المسماة Audioflow الاستماع إلى صوت التبول لتحديد التدفقات غير الطبيعية والمشاكل الصحية المقابلة للمريض بشكل فعال ونجاح.

أيها السقاة، انتبهوا: هذا الروبوت يمكنه مزج الكوكتيل في دقيقة واحدة فقط

لقد أدت الشيخوخة السكانية وانخفاض عدد السكان في اليابان إلى افتقار البلاد إلى عدد كبير من العمال الشباب، وخاصة في قطاع الخدمات.

أصيب المئات من الأشخاص بخيبة أمل عندما علموا أن الفتاة التي أحبوها كانت نتاج الذكاء الاصطناعي

أحد مستخدمي Reddit يُدعى u/LegalBeagle1966 هو واحد من العديد من المستخدمين الذين يعشقون كلوديا، وهي فتاة تشبه نجوم السينما والتي غالبًا ما تشارك صور سيلفي مغرية، حتى العارية منها، على هذه المنصة.

12 شركة محتملة أخرى تنضم إلى تحالف الذكاء الاصطناعي التابع لمايكروسوفت

أعلنت شركة مايكروسوفت للتو أن 12 شركة تقنية أخرى ستشارك في برنامج الذكاء الاصطناعي من أجل الخير.

يقوم الذكاء الاصطناعي بإعادة إنشاء شخصيات Dragon Ball باللحم والدم

استخدم المستخدم @mortecouille92 قوة أداة التصميم الجرافيكي Midjourney في العمل وأنشأ إصدارات واقعية فريدة من شخصيات Dragon Ball الشهيرة مثل Goku وVegeta وBulma وelder Kame. .

7 تقنيات لتحسين استجابات ChatGPT

فقط عن طريق إضافة بعض الشروط أو إعداد بعض السيناريوهات، يمكن لـ ChatGPT تقديم إجابات أكثر صلة باستفساراتك. دعونا نلقي نظرة على بعض الطرق التي يمكنك من خلالها تحسين جودة استجابات ChatGPT الخاصة بك.

تعجب من اللوحات الجميلة التي رسمها الذكاء الاصطناعي

Midjourney هو نظام ذكاء اصطناعي تسبب مؤخرًا في "حمى" في مجتمع الإنترنت وعالم الفنانين بسبب لوحاته الجميلة للغاية والتي ليست أقل شأنا من لوحات الفنانين الحقيقيين.

كان نموذج الذكاء الاصطناعي هذا من أوائل الخبراء الذين اكتشفوا أخبارًا عن تفشي الالتهاب الرئوي في ووهان.

وبعد أيام من إعلان الصين عن تفشي المرض، مع إمكانية الوصول إلى بيانات مبيعات تذاكر الطيران العالمية، واصل نظام الذكاء الاصطناعي BlueDot التنبؤ بدقة بانتشار فيروس كورونا ووهان إلى بانكوك وسيول وتايبيه وطوكيو.