Lemmatization في بايثون | دليل المبتدئين

في هذا البرنامج التعليمي ، سنناقش lemmatization في Python وهي طريقة تُستخدم لتجميع العناصر المختلفة للكلمة معًا. يهدف Lemmatization أيضًا إلى تقليل تصريف الكلمات والتركيز على توفير الشكل الجذر أو الأساسي للكلمة وهو ما تعنيه كلمة lemma .

جدول المحتويات

Lemmatization مقابل Stemming

Lemmatization مشابه للاشتقاق الذي يعمل أيضًا على تقليل التصريفات في الكلمات. الفرق الوحيد هو أن lemmatization تستخدم كلمات قائمة على القاموس كنتيجة لذلك.

من ناحية أخرى ، فإن الاشتقاق يزيل فقط اللواحق من الكلمة الملتوية والتي قد ينتج عنها كلمات غير موجودة.

على سبيل المثال ، إذا استخدمنا الاشتقاق إلى دراسات الكلمات ، فسوف نعطي الكلمة studi كمخرج لأنها تهدف إلى إزالة اللاحقة es من الكلمة دراسات .

من ناحية أخرى ، إذا تم استخدام lemmatization ، فسيتم إعطاء دراسة الكلمة نتيجة لذلك لأنها تركز على توفير الشكل الأساسي للكلمة.

الأشياء التي يجب مراعاتها في استخدام Lemmatization

  • يستخدم كلمات قائمة على القاموس. مع مصطلح lemma الذي يعني الجذر أو الشكل الأساسي للكلمة ، يهدف lemmatization إلى توفير الشكل الأساسي للكلمة بدلاً من مجرد إزالة تصريفات الكلمة.
  • يعتمد الأمر تمامًا على أجزاء الكلام للعثور على كلمة أساسية. بدون تحديد أجزاء الكلام) ، قد لا تعمل اللماتة بشكل جيد وقد لا تحصل على النتيجة التي تبحث عنها.
  • إنه أبطأ من الانبعاث ولكنه أقوى. نظرًا لأن lemmatization لا تتبع خوارزمية لأداء الكلمات والحاجة إلى توفير أجزاء من الكلام ، فإنها تعتبر أبطأ من الاشتقاق. ومع ذلك ، فهو أقوى من حيث أنه يستخدم الكلمات المستندة إلى القاموس للحصول على النتائج. 
  • لديها دقة أعلى في البحث عن كلمة الجذر. نظرًا لأن lemmatization تستخدم الكلمات المستندة إلى القاموس في تخطيط النتائج من كلمة مصحوبة ، سيكون لديك فرص أكبر للحصول على مخرجات دقيقة.

مرحلة التحضير للشفاء في لغة بايثون

قبل أن نبدأ في تنفيذ lemmatization ، لنبدأ باستيراد مكتبة Word من textblob .

Lemmatization في بايثون |  دليل المبتدئين

بعد ذلك ، سنقوم بإنشاء كائن كلمة. 

Lemmatization في بايثون |  دليل المبتدئين

لإنشاء كائن Word ، أنشأنا متغيرًا باسم w . ثم قمنا بتخزين مكتبة Word التي تحتوي على كائن كلمتنا وهو octopi ، وهو صيغة الجمع لكلمة octopus. لاحظ أنه عند تمرير عنصر باستخدام مكتبة Word ، من المهم إحاطة هذا العنصر باقتباسات مفردة.

دعنا نهيئ المتغير w لنرى ما إذا كان يحتوي على الكلمة object التي أنشأناها للتو.

Lemmatization في بايثون |  دليل المبتدئين

عند تنفيذ المتغير w ، نحصل على كلمة object octopi نتيجة لذلك.

تنفيذ Lemmatization في Python

بعد ذلك ، سنقوم بتنفيذ lemmatize باستخدام وظيفة .lemmatize

Lemmatization في بايثون |  دليل المبتدئين

في هذه الخطوة ، استخدمنا المتغير w الذي يحمل كلمة كائن octopi واستخدمنا الدالة .lemmatize لتطبيق lemmatization. نتيجة لذلك ، حصلنا على كلمة الأخطبوط وهي الجذر أو الشكل الأساسي لكلمة الأخطبوط .

بعد ذلك ، دعونا نحاول تطبيق lemmatization بكلمة أفضل .

Lemmatization في بايثون |  دليل المبتدئين

في المثال السابق ، قمنا بتحديث كائن الكلمة الخاص بنا من octopi إلى الأفضل . ثم قمنا بإزالتها مع وظيفة .lemmatize . وبالتالي ، فإن النتيجة التي حصلنا عليها هي نفس كلمة كائن التي استخدمناها.

باستخدام وظيفة .lemmatize ، يمكنك تغيير طريقة اللماتيز عن طريق تمرير جزء من الكلام. على سبيل المثال ، دعنا نحاول تمرير a إلى دالة .lemmatize التي تمثل صفة في أجزاء الكلام. 

Lemmatization في بايثون |  دليل المبتدئين

بعد إضافة جزء من الكلام إلى وظيفة .lemmatize ، يمكننا الحصول على الكلمة الأساسية جيدة نتيجة لذلك.

دعنا نغير موضوع كلمتنا مرة أخرى ليصبح قيد التشغيل . دعنا أيضًا نغير جزء الكلام الذي سنمرره إلى وظيفة .lemmatize إلى v والتي تعني الفعل.

Lemmatization في بايثون |  دليل المبتدئين

بعد إجراء التغييرات وتهيئة وظيفة .lemmatize ، حصلنا على الكلمة الجذرية للكلمة التي يتم تشغيلها نتيجة لذلك. معظم اللماتيزر غير قادرين على أداء الطرق التي استخدمناها للتو في استخدام وظيفة .lemmatize.

ومع ذلك ، تعد وظيفة .lemmatize أداة مهمة لاستخدامها عند إجراء أنواع معينة من تحليل النص في Python للحصول على الشكل الأساسي للكلمة.


كيفية استخدام برنامج بايثون النصي في LuckyTemplates
كيفية تحميل نماذج مجموعات البيانات في
الدالات التي يحددها المستخدم Python Python | لمحة عامة

خاتمة

باختصار ، نحن قادرون على فهم استخدام lemmatization في Python وكيف يعمل. لقد ناقشنا التشابه والاختلاف بين اللماتية من النبع أيضًا. يمكننا أيضًا إنشاء كائن Word باستخدام مكتبة Word وكيفية استخدام وظيفة .lemmatize .

علاوة على ذلك ، تعلمنا كيفية تطبيق أجزاء مختلفة من الكلام في وظيفة .lemmatize. سيساعدك تطبيق lemmatization في مهام تحليل النص اليومية بشكل كبير على تقليل الوقت والجهد في البحث عن الكلمة الأساسية لكلمة معينة.

أتمنى لك كل خير،

غيليم

Leave a Comment

تقنية تصور LuckyTemplates: تعرف على كيفية إنشاء لوحات تصميم الخلفية

تقنية تصور LuckyTemplates: تعرف على كيفية إنشاء لوحات تصميم الخلفية

تعرف على تقنية تصور LuckyTemplates هذه حتى تتمكن من إنشاء قوالب الخلفية واستيرادها إلى تقارير LuckyTemplates الخاصة بك.

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

كيفية حفظ وتحميل ملف RDS في R.

كيفية حفظ وتحميل ملف RDS في R.

ستتعلم كيفية حفظ وتحميل الكائنات من ملف .rds في R. ستغطي هذه المدونة أيضًا كيفية استيراد الكائنات من R إلى LuckyTemplates.

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

في هذا البرنامج التعليمي للغة ترميز DAX ، تعرف على كيفية استخدام وظيفة الإنشاء وكيفية تغيير عنوان القياس ديناميكيًا.

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

سيغطي هذا البرنامج التعليمي كيفية استخدام تقنية Multi Threaded Dynamic Visuals لإنشاء رؤى من تصورات البيانات الديناميكية في تقاريرك.

مقدمة لتصفية السياق في LuckyTemplates

مقدمة لتصفية السياق في LuckyTemplates

في هذه المقالة ، سأقوم بتشغيل سياق عامل التصفية. يعد سياق عامل التصفية أحد الموضوعات الرئيسية التي يجب على أي مستخدم LuckyTemplates التعرف عليها في البداية.

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أريد أن أوضح كيف يمكن لخدمة تطبيقات LuckyTemplates عبر الإنترنت أن تساعد في إدارة التقارير والرؤى المختلفة التي تم إنشاؤها من مصادر مختلفة.

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تعرف على كيفية إجراء تغييرات في هامش الربح باستخدام تقنيات مثل قياس التفرع والجمع بين صيغ DAX في LuckyTemplates.

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

سيناقش هذا البرنامج التعليمي أفكار تجسيد مخازن البيانات وكيفية تأثيرها على أداء DAX ​​في توفير النتائج.

إعداد تقارير الأعمال باستخدام LuckyTemplates

إعداد تقارير الأعمال باستخدام LuckyTemplates

إذا كنت لا تزال تستخدم Excel حتى الآن ، فهذا هو أفضل وقت لبدء استخدام LuckyTemplates لاحتياجات إعداد تقارير الأعمال الخاصة بك.