أعلنت شركة مايكروسوفت عن DeepSpeed، وهي مكتبة جديدة للتعلم العميق يمكنها دعم تدريب نماذج الذكاء الاصطناعي واسعة النطاق

أعلنت شركة مايكروسوفت عن DeepSpeed، وهي مكتبة جديدة للتعلم العميق يمكنها دعم تدريب نماذج الذكاء الاصطناعي واسعة النطاق

أحدثت شركة Microsoft Research مؤخرًا ضجة في عالم أبحاث الذكاء الاصطناعي (AI) عندما أعلنت عن التطوير الناجح لـ DeepSpeed، وهي مكتبة لتحسين التعلم العميق يمكن استخدامها لتدريب نماذج الذكاء الاصطناعي العملاقة بمقياس يصل إلى 100 مليار معلمة.

في تدريب الذكاء الاصطناعي، كلما كانت نماذج اللغة الطبيعية لديك أكبر، زادت الدقة. ومع ذلك، فإن تدريب نماذج كبيرة من اللغات الطبيعية يستهلك الكثير من الوقت، والتكاليف المترتبة عليه ليست صغيرة. تم إنشاء DeepSpeed ​​للتغلب على جميع الصعوبات المذكورة أعلاه: تحسين السرعة والتكلفة وحجم التدريب وسهولة الاستخدام.

بالإضافة إلى ذلك، ذكرت Microsoft أيضًا أن DeepSpeed ​​يشتمل أيضًا على ZeRO (Zero Redundancy Optimizer)، وهي تقنية تحسين متوازية تساعد على تقليل كمية الموارد اللازمة للنماذج، مع الاستمرار في المساعدة على زيادة عدد المعلمات والأرقام التي يمكن تدريبها. باستخدام مزيج من DeepSpeed ​​وZeRO، تمكن باحثو مايكروسوفت من تطوير نموذج جديد لتوليد لغة تورينج الطبيعية (Turing-NLG) بنجاح - وهو أكبر نموذج لغة اليوم مع 17 مليار معلمة.

أعلنت شركة مايكروسوفت عن DeepSpeed، وهي مكتبة جديدة للتعلم العميق يمكنها دعم تدريب نماذج الذكاء الاصطناعي واسعة النطاق

بعض النقاط البارزة في DeepSpeed:

  • النطاق: نماذج الذكاء الاصطناعي الكبيرة والمتقدمة الحالية مثل OpenAI GPT-2 وNVIDIA Megatron-LM وGoogle T5 لها مقياس يبلغ 1.5 مليار و8.3 مليار و11 مليار معلمة على التوالي. يمكن للمرحلة الأولى من Zero في DeepSpeed ​​توفير دعم النظام لتشغيل النماذج بما يصل إلى 100 مليار معلمة، وهو أكبر بعشر مرات من أكبر نموذج من Google.
  • السرعة: ستختلف الزيادات في الإنتاجية المسجلة وفقًا لتكوين الأجهزة. في مجموعات NVIDIA GPU ذات اتصالات النطاق الترددي المنخفض (بدون NVIDIA NVLink أو Infiniband)، يحقق DeepSpeed ​​تحسينًا في الإنتاجية بمقدار 3.75 مرة مقارنة باستخدام Megatron-LM وحده لنموذج GPT-2 القياسي مع 1.5 مليار معلمة. في مجموعات NVIDIA DGX-2 ذات اتصالات النطاق الترددي العالي، للنماذج التي تحتوي على 20 إلى 80 مليار معلمة، يكون DeepSpeed ​​أسرع من 3 إلى 5 مرات.
  • التكلفة: من خلال التحسينات في السرعة، تم أيضًا تحسين تكاليف التدريب بشكل كبير. على سبيل المثال، لتدريب نموذج يحتوي على 20 مليار معلمة، يتطلب DeepSpeed ​​موارد أقل بثلاث مرات من المعتاد.
  • سهولة الاستخدام: لا يلزم سوى بعض التغييرات الطفيفة في التعليمات البرمجية حتى تتمكن النماذج الحالية من التبديل إلى استخدام DeepSpeed ​​​​وZeRO. لا يتطلب DeepSpeed ​​​​إعادة تصميم التعليمات البرمجية أو إعادة هيكلة النموذج.

Microsoft مفتوحة المصدر لكل من DeepSpeed ​​​​وZeRO على GitHub ، يرجى الرجوع.


سيتم إنشاء فريق عمل ChatGPT من قبل أوروبا

سيتم إنشاء فريق عمل ChatGPT من قبل أوروبا

وقالت الهيئة التي توحد هيئات مراقبة الخصوصية الوطنية في أوروبا يوم الخميس إنها أنشأت فريق عمل مخصص لـ ChatGPT

يتنبأ الذكاء الاصطناعي بوقت وفاة الإنسان بدقة تصل إلى 78%

يتنبأ الذكاء الاصطناعي بوقت وفاة الإنسان بدقة تصل إلى 78%

تعاون علماء دنماركيون وأمريكيون لتطوير نظام ذكاء اصطناعي يسمى life2vec، قادر على التنبؤ بوقت وفاة الإنسان بدقة عالية.

يتنبأ الذكاء الاصطناعي بأمراض المسالك البولية بمجرد صوت البول

يتنبأ الذكاء الاصطناعي بأمراض المسالك البولية بمجرد صوت البول

يمكن لخوارزمية الذكاء الاصطناعي المسماة Audioflow الاستماع إلى صوت التبول لتحديد التدفقات غير الطبيعية والمشاكل الصحية المقابلة للمريض بشكل فعال ونجاح.

أيها السقاة، انتبهوا: هذا الروبوت يمكنه مزج الكوكتيل في دقيقة واحدة فقط

أيها السقاة، انتبهوا: هذا الروبوت يمكنه مزج الكوكتيل في دقيقة واحدة فقط

لقد أدت الشيخوخة السكانية وانخفاض عدد السكان في اليابان إلى افتقار البلاد إلى عدد كبير من العمال الشباب، وخاصة في قطاع الخدمات.

أصيب المئات من الأشخاص بخيبة أمل عندما علموا أن الفتاة التي أحبوها كانت نتاج الذكاء الاصطناعي

أصيب المئات من الأشخاص بخيبة أمل عندما علموا أن الفتاة التي أحبوها كانت نتاج الذكاء الاصطناعي

أحد مستخدمي Reddit يُدعى u/LegalBeagle1966 هو واحد من العديد من المستخدمين الذين يعشقون كلوديا، وهي فتاة تشبه نجوم السينما والتي غالبًا ما تشارك صور سيلفي مغرية، حتى العارية منها، على هذه المنصة.

12 شركة محتملة أخرى تنضم إلى تحالف الذكاء الاصطناعي التابع لمايكروسوفت

12 شركة محتملة أخرى تنضم إلى تحالف الذكاء الاصطناعي التابع لمايكروسوفت

أعلنت شركة مايكروسوفت للتو أن 12 شركة تقنية أخرى ستشارك في برنامج الذكاء الاصطناعي من أجل الخير.

يقوم الذكاء الاصطناعي بإعادة إنشاء شخصيات Dragon Ball باللحم والدم

يقوم الذكاء الاصطناعي بإعادة إنشاء شخصيات Dragon Ball باللحم والدم

استخدم المستخدم @mortecouille92 قوة أداة التصميم الجرافيكي Midjourney في العمل وأنشأ إصدارات واقعية فريدة من شخصيات Dragon Ball الشهيرة مثل Goku وVegeta وBulma وelder Kame. .

7 تقنيات لتحسين استجابات ChatGPT

7 تقنيات لتحسين استجابات ChatGPT

فقط عن طريق إضافة بعض الشروط أو إعداد بعض السيناريوهات، يمكن لـ ChatGPT تقديم إجابات أكثر صلة باستفساراتك. دعونا نلقي نظرة على بعض الطرق التي يمكنك من خلالها تحسين جودة استجابات ChatGPT الخاصة بك.

تعجب من اللوحات الجميلة التي رسمها الذكاء الاصطناعي

تعجب من اللوحات الجميلة التي رسمها الذكاء الاصطناعي

Midjourney هو نظام ذكاء اصطناعي تسبب مؤخرًا في "حمى" في مجتمع الإنترنت وعالم الفنانين بسبب لوحاته الجميلة للغاية والتي ليست أقل شأنا من لوحات الفنانين الحقيقيين.

كان نموذج الذكاء الاصطناعي هذا من أوائل الخبراء الذين اكتشفوا أخبارًا عن تفشي الالتهاب الرئوي في ووهان.

كان نموذج الذكاء الاصطناعي هذا من أوائل الخبراء الذين اكتشفوا أخبارًا عن تفشي الالتهاب الرئوي في ووهان.

وبعد أيام من إعلان الصين عن تفشي المرض، مع إمكانية الوصول إلى بيانات مبيعات تذاكر الطيران العالمية، واصل نظام الذكاء الاصطناعي BlueDot التنبؤ بدقة بانتشار فيروس كورونا ووهان إلى بانكوك وسيول وتايبيه وطوكيو.