يقوم نموذج ديزني للذكاء الاصطناعي بإنشاء تسلسلات متحركة من النصوص

يقوم نموذج ديزني للذكاء الاصطناعي بإنشاء تسلسلات متحركة من النصوص

من الناحية الواقعية، فإن حقيقة أن الذكاء الاصطناعي يمكنه إنشاء مقاطع أصلية من جزء واحد أو أكثر من النص لا يعد خبرًا زلزاليًا في عالم التكنولوجيا. في العام الماضي، قام الباحثون بتفصيل كيفية استغلال النظام للشبكات العصبية - طبقات من الوظائف الرياضية المصممة على غرار الشبكات العصبية البيولوجية (الخلايا العصبية) - لإنشاء مقتطفات من المعلومات. يبلغ طول الفيديو 32 إطارًا وحجمه 64 × 64 بكسل من العديد من الأوصاف المثيرة للذكريات، مثل مثل "لعب كرة القدم على العشب". ومع ذلك، وفقًا لمقال جديد نُشر على موقع Arxiv.org، نجح العلماء في Disney Research وRutgers في أخذ هذه الفكرة خطوة أخرى إلى الأمام من خلال نموذج الذكاء الاصطناعي للكلمات المتقاطعة. من البداية إلى النهاية، من الممكن إنشاء حبكة تقريبية مثل بالإضافة إلى أوصاف الفيديو للنص من السيناريوهات. على وجه التحديد، يساعد نموذج العلماء لتحويل النص إلى رسوم متحركة في إنشاء رسوم متحركة دون الحاجة إلى بيانات توضيحية - وهي خطوة أولية تُستخدم لتوفير نص إدخال وصفي للأنشطة.

"يعد إنشاء الرسوم المتحركة تلقائيًا من نص باللغة الطبيعية تقنية مفيدة جدًا يمكن تطبيقها في عدد من المجالات مثل كتابة نصوص الأفلام أو إنشاء مقاطع فيديو تعليمية. ستكون أنظمة الذكاء الاصطناعي هذه ذات قيمة خاصة عند تطبيقها على البرمجة النصية من خلال السماح بالتكرار السريع والنماذج الأولية وإثبات المفهوم. في هذا البحث، نجحنا في تطوير نظام تحويل النص إلى رسوم متحركة قادر على التعامل مع الجمل المعقدة بشكل مرضي. "إن الغرض من نظام الذكاء الاصطناعي هذا ليس استبدال الكتاب أو كتاب السيناريو بشكل كامل، ولكن إنشاء مساعد ذكاء اصطناعي قادر على دعم كتاب السيناريو بشكل فعال وجعل عملهم أسهل وأكثر إثارة للاهتمام"، كما شارك فريق البحث.

وكما أوضح الباحثون، فإن ترجمة النص إلى رسوم متحركة ليست مهمة بسيطة. في الواقع، كلا الجمل (بيانات الإدخال) والرسوم المتحركة (بيانات الإخراج) ليس لها بنية ثابتة. وهذا أيضًا هو السبب وراء عدم قدرة معظم أدوات تحويل النص إلى فيديو الحالية على التعامل مع أنماط الجملة المعقدة. ولمعالجة القيود المفروضة على الأنظمة الحالية، قام فريق البحث ببناء شبكة عصبية معيارية تتضمن عددًا من المكونات مثل: وحدة تحليل نص جديدة، والتي تعزل النص ذو الصلة تلقائيًا ديناميكيًا عن أوصاف المشهد في النص؛ وحدة معالجة اللغة الطبيعية التي تعمل على تبسيط أنماط الجملة المعقدة باستخدام مجموعة من قواعد اللغة وتستخرج المعلومات من الجمل المبسطة إلى تمثيلات عمل محددة مسبقًا؛ ووحدة الرسوم المتحركة المسؤولة عن تحويل التمثيلات المذكورة إلى تسلسلات رسوم متحركة متعددة.

يقوم نموذج ديزني للذكاء الاصطناعي بإنشاء تسلسلات متحركة من النصوص

وفقًا للباحثين، فإن هذا النهج المبسط يجعل من السهل جدًا استخراج معلومات البرنامج النصي الرئيسية، وسيكون نظامهم قادرًا على التعرف تلقائيًا عندما يتم إعطاء جزء من التعليمات البرمجية بنية نحوية معينة، ثم تحليلها وتجميعها إلى جمل أبسط، وبعد ذلك معالجتها بشكل متكرر حتى لا يكون من الممكن إجراء مزيد من التبسيط. سيتم تطبيق "خطوة التنسيق" التالية على الجمل التي لها نفس العلاقة النحوية وفي نفس الوقت تؤدي نفس الدور الوظيفي. وأخيرًا، سيتم تبسيط محاكي المفردات الذي يطابق الإجراءات الموضحة في الجمل من خلال 52 رسمًا متحركًا مختلفًا (والتي يمكن توسيعها إلى 92 رسمًا متحركًا باستخدام قاموس المرادفات) في مكتبة محددة مسبقًا.

يستخدم نظام يسمى Cardinal هذه الرسوم المتحركة كمدخلات للإجراءات وينشئ تصورات مسبقة في Unreal - وهو محرك ألعاب فيديو شائع تم تطويره بواسطة Epic Games. استنادًا إلى مكتبة الرسوم المتحركة المحددة مسبقًا، سيتم تحميل الكائنات والنماذج أيضًا التي يمكن استخدامها لإنشاء الشخصيات مسبقًا، مما يساعد في إنشاء مقاطع فيديو رسوم متحركة ثلاثية الأبعاد تصور بشكل وثيق السيناريو المعالج.

يقوم نموذج ديزني للذكاء الاصطناعي بإنشاء تسلسلات متحركة من النصوص

لتدريب هذا النظام المتفوق، بدأ الباحثون في تجميع قاعدة بيانات لوصف المشهد تتكون من 996 سيناريو، مستوحاة من أكثر من 1000 نص مأخوذ من مصادر متاحة مجانًا، بما في ذلك IMSDb وSimplyScripts وScriptORama5. في المجمل، تتضمن هذه المجموعة 525,708 وصفًا تحتوي على 1,402,864 جملة، 920,817 (أكثر من 40%) منها تحتوي على فعل واحد على الأقل يصف فعلًا ما.

في تجربة نوعية، طلب العلماء من 22 مشاركًا تقييم 20 رسمًا متحركًا أنشأه النظام على مقياس مكون من 5 نقاط (على سبيل المثال، هل يتم عرض الفيديو متحركًا بشكل مناسب بالنظر إلى محتوى النص؟ نص؟، أو ما مقدار المعلومات النصية التي تم وصفها في الفيديو وكم المعلومات الواردة في الفيديو المذكورة في النص)، قال 68% من المشاركين إن النظام أنشأ رسومًا متحركة فعالة ذات قيمة عادلة من سيناريوهات الإدخال - ليس معدلًا مرتفعًا بشكل خاص ولكنه يستحق الثناء للغاية.

وهذا يدل على أن هذا ليس نظامًا مثاليًا حقًا. في الواقع، قائمة الأفعال وكائناتها ليست شاملة، وفي بعض الأحيان لا تتمكن عملية التبسيط المعجمي من تعيين الأفعال المعقدة بنجاح إلى الرسوم المتحركة المماثلة، أو لا يوجد سوى إمكانية إنشاء بضع جمل بسيطة لفعل يحتوي على فاعلين متعددين في الجملة الأصلية . ومع ذلك، هذه لا تزال دراسة شابة وهذه القيود مفهومة تماما. ويعتزم الباحثون معالجة أوجه القصور المذكورة أعلاه في المستقبل القريب.

يقوم نموذج ديزني للذكاء الاصطناعي بإنشاء تسلسلات متحركة من النصوص

"لقد أظهرت التقييمات الداخلية والخارجية أداءً معقولاً لهذا النظام، وأردنا الاستفادة من معلومات الخطاب من خلال فحص تسلسل الإجراءات الموضحة في أجزاء النص. سيساعد هذا أيضًا في حل نقاط الغموض في النص فيما يتعلق بالإجراءات. علاوة على ذلك، يمكن استخدام نظامنا لتوليد البيانات اللازمة لتدريب أنظمة عصبية مماثلة شاملة.


سيتم إنشاء فريق عمل ChatGPT من قبل أوروبا

سيتم إنشاء فريق عمل ChatGPT من قبل أوروبا

وقالت الهيئة التي توحد هيئات مراقبة الخصوصية الوطنية في أوروبا يوم الخميس إنها أنشأت فريق عمل مخصص لـ ChatGPT

يتنبأ الذكاء الاصطناعي بوقت وفاة الإنسان بدقة تصل إلى 78%

يتنبأ الذكاء الاصطناعي بوقت وفاة الإنسان بدقة تصل إلى 78%

تعاون علماء دنماركيون وأمريكيون لتطوير نظام ذكاء اصطناعي يسمى life2vec، قادر على التنبؤ بوقت وفاة الإنسان بدقة عالية.

يتنبأ الذكاء الاصطناعي بأمراض المسالك البولية بمجرد صوت البول

يتنبأ الذكاء الاصطناعي بأمراض المسالك البولية بمجرد صوت البول

يمكن لخوارزمية الذكاء الاصطناعي المسماة Audioflow الاستماع إلى صوت التبول لتحديد التدفقات غير الطبيعية والمشاكل الصحية المقابلة للمريض بشكل فعال ونجاح.

أيها السقاة، انتبهوا: هذا الروبوت يمكنه مزج الكوكتيل في دقيقة واحدة فقط

أيها السقاة، انتبهوا: هذا الروبوت يمكنه مزج الكوكتيل في دقيقة واحدة فقط

لقد أدت الشيخوخة السكانية وانخفاض عدد السكان في اليابان إلى افتقار البلاد إلى عدد كبير من العمال الشباب، وخاصة في قطاع الخدمات.

أصيب المئات من الأشخاص بخيبة أمل عندما علموا أن الفتاة التي أحبوها كانت نتاج الذكاء الاصطناعي

أصيب المئات من الأشخاص بخيبة أمل عندما علموا أن الفتاة التي أحبوها كانت نتاج الذكاء الاصطناعي

أحد مستخدمي Reddit يُدعى u/LegalBeagle1966 هو واحد من العديد من المستخدمين الذين يعشقون كلوديا، وهي فتاة تشبه نجوم السينما والتي غالبًا ما تشارك صور سيلفي مغرية، حتى العارية منها، على هذه المنصة.

12 شركة محتملة أخرى تنضم إلى تحالف الذكاء الاصطناعي التابع لمايكروسوفت

12 شركة محتملة أخرى تنضم إلى تحالف الذكاء الاصطناعي التابع لمايكروسوفت

أعلنت شركة مايكروسوفت للتو أن 12 شركة تقنية أخرى ستشارك في برنامج الذكاء الاصطناعي من أجل الخير.

يقوم الذكاء الاصطناعي بإعادة إنشاء شخصيات Dragon Ball باللحم والدم

يقوم الذكاء الاصطناعي بإعادة إنشاء شخصيات Dragon Ball باللحم والدم

استخدم المستخدم @mortecouille92 قوة أداة التصميم الجرافيكي Midjourney في العمل وأنشأ إصدارات واقعية فريدة من شخصيات Dragon Ball الشهيرة مثل Goku وVegeta وBulma وelder Kame. .

7 تقنيات لتحسين استجابات ChatGPT

7 تقنيات لتحسين استجابات ChatGPT

فقط عن طريق إضافة بعض الشروط أو إعداد بعض السيناريوهات، يمكن لـ ChatGPT تقديم إجابات أكثر صلة باستفساراتك. دعونا نلقي نظرة على بعض الطرق التي يمكنك من خلالها تحسين جودة استجابات ChatGPT الخاصة بك.

تعجب من اللوحات الجميلة التي رسمها الذكاء الاصطناعي

تعجب من اللوحات الجميلة التي رسمها الذكاء الاصطناعي

Midjourney هو نظام ذكاء اصطناعي تسبب مؤخرًا في "حمى" في مجتمع الإنترنت وعالم الفنانين بسبب لوحاته الجميلة للغاية والتي ليست أقل شأنا من لوحات الفنانين الحقيقيين.

كان نموذج الذكاء الاصطناعي هذا من أوائل الخبراء الذين اكتشفوا أخبارًا عن تفشي الالتهاب الرئوي في ووهان.

كان نموذج الذكاء الاصطناعي هذا من أوائل الخبراء الذين اكتشفوا أخبارًا عن تفشي الالتهاب الرئوي في ووهان.

وبعد أيام من إعلان الصين عن تفشي المرض، مع إمكانية الوصول إلى بيانات مبيعات تذاكر الطيران العالمية، واصل نظام الذكاء الاصطناعي BlueDot التنبؤ بدقة بانتشار فيروس كورونا ووهان إلى بانكوك وسيول وتايبيه وطوكيو.