يقوم الذكاء الاصطناعي من Microsoft بإنشاء أصوات واقعية من خلال 200 عينة تدريب فقط

يقوم الذكاء الاصطناعي من Microsoft بإنشاء أصوات واقعية من خلال 200 عينة تدريب فقط

تمتلك خوارزميات تحويل النص إلى كلام الحديثة قدرات مذهلة. أوضح دليل على ذلك هو أداتان مفتوحتان المصدر تسمى SpecAugment وTranslatotron، اللتان أصدرتهما Google مؤخرًا. على وجه الخصوص، يمكن لـ Translatotron أن يترجم بشكل كامل خطاب الشخص مباشرة إلى لغة أخرى مع الحفاظ على لهجة الجملة ونغمة صوتها. ومع ذلك، فإن الإبداع في التكنولوجيا لا حدود له، وهناك دائمًا مجال لمزيد من الأشياء غير العادية.

يقوم الذكاء الاصطناعي من Microsoft بإنشاء أصوات واقعية من خلال 200 عينة تدريب فقط

قدم باحثو الذكاء الاصطناعي في مايكروسوفت مؤخرا ورقة بحثية بعنوان "تحويل النص إلى كلام بدون إشراف تقريبا والتعرف التلقائي على الكلام"، والذي يعرض تفاصيل نظام الذكاء الاصطناعي الذي يعزز التعلم غير الخاضع للرقابة. التعلم غير الخاضع للرقابة - وهو فرع من تكنولوجيا التعلم الآلي، يساعد الذكاء الاصطناعي على اكتساب القدرة على تعلم المعرفة. من بيانات الاختبار غير المسماة والمصنفة وغير المنسقة. أحدث نظام الذكاء الاصطناعي هذا من مايكروسوفت ضجة كبيرة عندما حقق دقة في فهم القراءة ومعالجة النصوص تصل إلى 99.84%، وفي الوقت نفسه، تم أيضًا تحسين قدرة محاكاة الكلام التلقائي إلى 11.7%. والأمر الأكثر إثارة للإعجاب هو أن نموذج التعلم الآلي المتقدم هذا يحتاج فقط إلى استخدام 200 مقطع صوتي والنسخ المقابلة كبيانات تدريب الإدخال.

المفتاح لتطوير نموذج الذكاء الاصطناعي هذا هو المحولات، وهي نوع من الهندسة العصبية التي بناها فريق من العلماء في Google Brain، ذراع أبحاث الذكاء الاصطناعي لشركة Google، وتم تقديمها في مقالة تقنية متعمقة في عام 2017. مثل جميع الشبكات العصبية العميقة، المحوات تحتوي على خلايا عصبية (وظائف رياضية تم تصميمها "بشكل فضفاض" بواسطة الخلايا العصبية البيولوجية) مرتبة في طبقات مترابطة لنقل "الإشارات" من البيانات المدخلة وضبط القوة التشابكية - الوزن - لكل اتصال تدريجيًا (وهي الطريقة التي تستخرج بها النماذج الميزات وتتعلم كيفية جعل التنبؤات). ومع ذلك، تمتلك المحولات أيضًا ميزة فريدة: سيتم توصيل كل عنصر مخرجات بجميع عناصر الإدخال ويتم حساب الأوزان بينها بمرونة شديدة.

يقوم الذكاء الاصطناعي من Microsoft بإنشاء أصوات واقعية من خلال 200 عينة تدريب فقط

ومن هذا الواقع، شرع باحثو مايكروسوفت في دمج مكون Transformer في تصميم نظام الذكاء الاصطناعي الخاص بهم، مما يجعل من الممكن استقبال الكلام أو النص كبيانات إدخال أو إخراج. وقرر الباحثون اتخاذ مصدر بيانات LJSpeech المتاح للجمهور - والذي يحتوي على 13100 مقتطف صوتي باللغة الإنجليزية والنصوص المقابلة (النصوص) - كبيانات تدريبية لنظام الذكاء الاصطناعي. بعد ذلك، اختار فريق البحث بشكل عشوائي 200 من 13100 مقتطف صوتي مذكور أعلاه لإنشاء مجموعة بيانات تدريبية، كما استفادوا أيضًا من مكون ترميز تقليل الضوضاء التلقائي لإعادة بناء البيانات. تم كسر هياكل الكلام والنص.

النتائج ليست سيئة على الإطلاق. وبالنظر إلى كل مقتطف صغير، وجد الباحثون أنه أعطى نتائج أفضل من الخوارزميات الأساسية المستخدمة في الاختبارات. ويبدو أن عددًا قليلًا من العينات الناتجة يشبه إلى حد كبير أنها تم إنشاؤها بواسطة البشر.

فمثلاً الجملة: "يجب أن تكون أشكال الحروف المطبوعة جميلة وأن يكون ترتيبها في الصفحة معقولاً ومساعداً على شكل الحروف نفسها" تقرأ على النحو التالي:

أو الجملة: "خصوصًا أنه لم يعد هناك وقت مشغول أو تكاليف في صب أو طباعة الحروف الجميلة":

من الآن فصاعدا، هدف الباحثين هو تجاوز حدود تكنولوجيا التعلم غير الخاضعة للرقابة من خلال الاستفادة الكاملة من بيانات النص والكلام غير المقترنة، بمساعدة الأساليب المتقدمة. تتوفر طرق الحفر المسبق. "بالنسبة لهذه المهمة، اقترحنا نهجًا غير خاضع للرقابة تقريبًا لتحويل النص إلى كلام والتعرف التلقائي على الكلام، والذي يستخدم فقط عددًا قليلاً من بيانات النص والكلام المتسلسلة المتسلسلة وكمية صغيرة من البيانات الإضافية غير المتسلسلة. كما هو موضح في التجارب، ستكون مكونات التصميم لدينا ضرورية لتطوير القدرة على تحويل الكلام والنص مع بعض البيانات المتسلسلة.

وستعرض مايكروسوفت تفاصيل هذا المشروع في المؤتمر الدولي للتعلم الآلي الذي سيعقد في لونج بيتش بولاية كاليفورنيا في الفترة من 10 إلى 15 يونيو، ويخطط فريق البحث أيضًا لإصدار مفتوح المصدر في الأسابيع المقبلة.


سيتم إنشاء فريق عمل ChatGPT من قبل أوروبا

سيتم إنشاء فريق عمل ChatGPT من قبل أوروبا

وقالت الهيئة التي توحد هيئات مراقبة الخصوصية الوطنية في أوروبا يوم الخميس إنها أنشأت فريق عمل مخصص لـ ChatGPT

يتنبأ الذكاء الاصطناعي بوقت وفاة الإنسان بدقة تصل إلى 78%

يتنبأ الذكاء الاصطناعي بوقت وفاة الإنسان بدقة تصل إلى 78%

تعاون علماء دنماركيون وأمريكيون لتطوير نظام ذكاء اصطناعي يسمى life2vec، قادر على التنبؤ بوقت وفاة الإنسان بدقة عالية.

يتنبأ الذكاء الاصطناعي بأمراض المسالك البولية بمجرد صوت البول

يتنبأ الذكاء الاصطناعي بأمراض المسالك البولية بمجرد صوت البول

يمكن لخوارزمية الذكاء الاصطناعي المسماة Audioflow الاستماع إلى صوت التبول لتحديد التدفقات غير الطبيعية والمشاكل الصحية المقابلة للمريض بشكل فعال ونجاح.

أيها السقاة، انتبهوا: هذا الروبوت يمكنه مزج الكوكتيل في دقيقة واحدة فقط

أيها السقاة، انتبهوا: هذا الروبوت يمكنه مزج الكوكتيل في دقيقة واحدة فقط

لقد أدت الشيخوخة السكانية وانخفاض عدد السكان في اليابان إلى افتقار البلاد إلى عدد كبير من العمال الشباب، وخاصة في قطاع الخدمات.

أصيب المئات من الأشخاص بخيبة أمل عندما علموا أن الفتاة التي أحبوها كانت نتاج الذكاء الاصطناعي

أصيب المئات من الأشخاص بخيبة أمل عندما علموا أن الفتاة التي أحبوها كانت نتاج الذكاء الاصطناعي

أحد مستخدمي Reddit يُدعى u/LegalBeagle1966 هو واحد من العديد من المستخدمين الذين يعشقون كلوديا، وهي فتاة تشبه نجوم السينما والتي غالبًا ما تشارك صور سيلفي مغرية، حتى العارية منها، على هذه المنصة.

12 شركة محتملة أخرى تنضم إلى تحالف الذكاء الاصطناعي التابع لمايكروسوفت

12 شركة محتملة أخرى تنضم إلى تحالف الذكاء الاصطناعي التابع لمايكروسوفت

أعلنت شركة مايكروسوفت للتو أن 12 شركة تقنية أخرى ستشارك في برنامج الذكاء الاصطناعي من أجل الخير.

يقوم الذكاء الاصطناعي بإعادة إنشاء شخصيات Dragon Ball باللحم والدم

يقوم الذكاء الاصطناعي بإعادة إنشاء شخصيات Dragon Ball باللحم والدم

استخدم المستخدم @mortecouille92 قوة أداة التصميم الجرافيكي Midjourney في العمل وأنشأ إصدارات واقعية فريدة من شخصيات Dragon Ball الشهيرة مثل Goku وVegeta وBulma وelder Kame. .

7 تقنيات لتحسين استجابات ChatGPT

7 تقنيات لتحسين استجابات ChatGPT

فقط عن طريق إضافة بعض الشروط أو إعداد بعض السيناريوهات، يمكن لـ ChatGPT تقديم إجابات أكثر صلة باستفساراتك. دعونا نلقي نظرة على بعض الطرق التي يمكنك من خلالها تحسين جودة استجابات ChatGPT الخاصة بك.

تعجب من اللوحات الجميلة التي رسمها الذكاء الاصطناعي

تعجب من اللوحات الجميلة التي رسمها الذكاء الاصطناعي

Midjourney هو نظام ذكاء اصطناعي تسبب مؤخرًا في "حمى" في مجتمع الإنترنت وعالم الفنانين بسبب لوحاته الجميلة للغاية والتي ليست أقل شأنا من لوحات الفنانين الحقيقيين.

كان نموذج الذكاء الاصطناعي هذا من أوائل الخبراء الذين اكتشفوا أخبارًا عن تفشي الالتهاب الرئوي في ووهان.

كان نموذج الذكاء الاصطناعي هذا من أوائل الخبراء الذين اكتشفوا أخبارًا عن تفشي الالتهاب الرئوي في ووهان.

وبعد أيام من إعلان الصين عن تفشي المرض، مع إمكانية الوصول إلى بيانات مبيعات تذاكر الطيران العالمية، واصل نظام الذكاء الاصطناعي BlueDot التنبؤ بدقة بانتشار فيروس كورونا ووهان إلى بانكوك وسيول وتايبيه وطوكيو.