تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

في هذه المدونة ، سنوضح لك كيفية إجراء تحليل نصي باستخدام Python لتحديد أجزاء الكلام في البيانات النصية داخل LuckyTemplates. سنغطي خطوات استخدام Python لتحليل النص ونقدم أمثلة ونصائح لمساعدتك على البدء في مشاريع تحليل النص الخاصة بك. يمكنك مشاهدة الفيديو الكامل لهذا البرنامج التعليمي أسفل هذه المدونة.

جدول المحتويات

مصدر معلومات

في هذا البرنامج التعليمي ، سنستخدم سحابة كلمات جاهزة تحتوي على النصوص التي سنقوم بتقييمها. يظهر هذا على الجانب الأيسر من الصورة أدناه. على الجانب الأيمن ، لدينا المرشحات لتحديد أجزاء الكلام المختلفة ، على سبيل المثال ، الصفات أو الأفعال. 

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

يمكننا تصفية الكلمات التي هي ظرف ، وأسماء ، وأنواع مختلفة من الأسماء أو الأفعال ، وقواعد الفعل. هذا مفيد جدًا عند إنشاء حملة تسويقية والبحث عن كلمات في مراجعات العملاء. 

لنبدأ بفتح محرر Power Query الخاص بنا . 

في بيانات المصدر لدينا ، لدينا أعمدة للمعرفات والعمر والعنوان ونص المراجعة. سنركز على عمود مراجعة النص ، وسنقوم بتحليله لإجراء تحليل نصي. هناك أيضًا فئات أخرى قد تكون مفيدة في تحليلنا.

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

تحليل النص باستخدام بايثون

لنبدأ بالبيانات العادية التي أدخلناها. أول شيء سنفعله هو تصفية الصفوف لأن لدينا الكثير من البيانات ، وعندما نقوم بتحليل النص ، يستغرق الأمر وقتًا. 

لتصفية بياناتنا ، خذ أول 50 صفاً لجعل تحليل النص أسرع قليلاً. 

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

بمجرد التصفية ، انتقل إلى Transform و Run Python script. سنقوم بترميز كل شيء هنا لأنه لا يوجد الكثير من التعليمات البرمجية. 

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

استيراد الطرود

دعنا نحضر حزمتين لتحليل نص Python باستخدام محرر نص Python الخاص بنا . سنقوم "باستيراد الباندا كـ pd" ، مكتبة معالجة البيانات الخاصة بنا ليتم حفظها كـ pd متغير. ثم " من نص blob " ، سنقوم " باستيراد TextBlob" بحرف كبير بين الكلمات. 

يمكننا دائمًا توثيق ما نقوم به من خلال وضع سلسلة من المستندات. دعنا نكتب #bring في المكتبات الأساسية فوق حزمنا.

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

إعادة تسمية المتغير

في السطر الأول من البرنامج النصي ، يوجد هذا السطر المقدم من LuckyTemplates الذي يقول # "مجموعة البيانات" تحتفظ ببيانات الإدخال لهذا البرنامج النصي. يقول هذا السطر أن بياناتنا تسمى مجموعة البيانات. 

لذلك دعونا نغير ذلك لأنه يستغرق وقتًا طويلاً لكتابة "مجموعة البيانات". اكتب # تغيير متغير مجموعة البيانات و df = مجموعة البيانات في السطر التالي.

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

الآن أصبح كتابة المتغير أقصر. 

القيام بتحليل النص

دعنا ننتقل إلى تحليل النص الخاص بنا. تذكر أن نصوص المراجعة الخاصة بنا موجودة في عمود به خلايا فردية. هذا الإعداد ليس مفيدًا لنا حقًا لأننا نريد جميع النصوص معًا حتى نتمكن من إجراء تحليل عليها. 

ومع ذلك ، لا نريد ضمهم بدون مسافة ، لذلك دعونا نبدأ الكود الخاص بنا بمسافة داخل علامة اقتباس مزدوجة .  

ثم دعونا نضيف .join وعزل عمود نص المراجعة الخاص بنا باستخدام متغير df ، الذي يحتوي على مجموعة البيانات. اكتب "مراجعة النص" الموضوعة داخل رمز القوس الذي يعزل العمود. 

سينضم هذا الرمز إلى كل شيء ، لكننا نحتاج إلى حفظه ، لذلك دعونا ننشئ متغيرًا يسمى الكلمات.

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

بمجرد أن نحصل على كل الكلمات معًا ، يمكننا بعد ذلك استخدام blob النص الخاص بنا لبدء تحليل الكلمات. 

أول شيء يجب القيام به هو إنشاء أجزاء الكلام الخاصة بنا باستخدام متغير blob الذي نحتاجه لتمرير الكلمات إلى blob نصي. سنستخدم هذا النص ونمرره في النص ، وهو كلماتنا . تتم كتابة هذا على هيئة blob = TextBlob (كلمات).

الآن بعد أن أصبح لدينا هذه النقطة ، سنأخذها وننشئ متغير parts_of_speech باستخدام blob.tags . ستكون العلامات هي الاختصارات لكل جزء من أجزاء الكلام. 

ما سنفعله بعد ذلك هو حفظ هذا كإطار بيانات باستخدام Pandas التي جلبناها. دعنا نسميها بياناتنا التي تساوي pd.DataFrame وسنقوم بإدخال أجزائنا في الكلام

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

لنضغط على "موافق" لتشغيل الكود الخاص بنا. بعد تشغيل الكود ، يجب أن نحصل على جدول بالمتغيرات الخاصة بنا. لدينا مجموعة البيانات أو بياناتنا الأصلية. لدينا أيضًا بياناتنا و df

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

إذا لم تحصل على النتائج المرجوة ، فسنعرض لك الطرق المختلفة لتجنب بعض الأخطاء التي قد تحصل عليها في الكود.

إصلاح كود تحليل النص في بايثون

في بعض الأحيان ، قد نحتاج إلى أن نكون صريحين جدًا في تغيير تنسيق النص الذي نهتم به. 

يمكننا القيام بذلك عن طريق استدعاء متغير df الخاص بنا ، وعزل "مراجعة النص " الموضوعة داخل ترميز قوس ، ثم تغيير النوع إلى سلاسل باستخدام .astype ('str') . ثم أعد حفظ هذا في متغير df

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

انقر فوق "موافق" لإعادة تشغيل الرمز. يجب أن نحصل على نفس النتائج التي حصلنا عليها سابقًا.

الآن ، نريد أن نفتح بياناتنا ، المتغير الأخير الذي أدخلناه لنرى كيف يبدو ذلك. 

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

يجب أن تكون كل كلماتنا مقسمة إلى أجزاء من الكلام. لم نقم بتسمية أعمدتنا بعد ، ولكن يمكننا القيام بذلك بسهولة. 

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

في الإصدار القديم من تحليل النص نفسه ، أطلقت على العمود الأول كلمة Word والثاني باسم الاختصار

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

في استعلام أجزاء الكلام ، نقوم بإحضار الكلمات الفعلية لهذه الاختصارات وربطها معًا.

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

الآن ، دعنا نغلق ونطبق

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام

سمحت لنا الخطوات التي قمنا بتصفية أجزاء الكلام المختلفة التي حددناها باستخدام رمز Python البسيط . إنه يعطينا هذه الصورة المرئية في LuckyTemplates حيث يمكننا بسهولة تصفية نصنا بناءً على أجزاء فئة الكلام التي يقعون فيها. 

تحليل النص باستخدام بايثون: كيفية التعرف على أجزاء من الكلام


تحليل النص في بايثون | مقدمة
وظائف يحددها مستخدم بايثون | نظرة عامة على
قائمة Python وللحلقة في LuckyTemplates

خاتمة

بصفتك محلل بيانات ، قد تواجه الحاجة إلى استخراج الأفكار والمعنى من كميات كبيرة من البيانات النصية غير المنظمة. ما تعلمته هو طريقة مفيدة لفهم البيانات النصية من خلال تحليل النص.

الآن ، يمكنك بسهولة تقسيم النص إلى وحدات أصغر مثل الكلمات والجمل ، ثم تحليل هذه الوحدات لمعرفة الأنماط والعلاقات. يمكنك تحقيق كل هذه الأهداف باستخدام تحليل النص في Python و LuckyTemplates. 

أتمنى لك كل خير،


ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

كيفية حفظ وتحميل ملف RDS في R.

كيفية حفظ وتحميل ملف RDS في R.

ستتعلم كيفية حفظ وتحميل الكائنات من ملف .rds في R. ستغطي هذه المدونة أيضًا كيفية استيراد الكائنات من R إلى LuckyTemplates.

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

في هذا البرنامج التعليمي للغة ترميز DAX ، تعرف على كيفية استخدام وظيفة الإنشاء وكيفية تغيير عنوان القياس ديناميكيًا.

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

سيغطي هذا البرنامج التعليمي كيفية استخدام تقنية Multi Threaded Dynamic Visuals لإنشاء رؤى من تصورات البيانات الديناميكية في تقاريرك.

مقدمة لتصفية السياق في LuckyTemplates

مقدمة لتصفية السياق في LuckyTemplates

في هذه المقالة ، سأقوم بتشغيل سياق عامل التصفية. يعد سياق عامل التصفية أحد الموضوعات الرئيسية التي يجب على أي مستخدم LuckyTemplates التعرف عليها في البداية.

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أريد أن أوضح كيف يمكن لخدمة تطبيقات LuckyTemplates عبر الإنترنت أن تساعد في إدارة التقارير والرؤى المختلفة التي تم إنشاؤها من مصادر مختلفة.

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تعرف على كيفية إجراء تغييرات في هامش الربح باستخدام تقنيات مثل قياس التفرع والجمع بين صيغ DAX في LuckyTemplates.

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

سيناقش هذا البرنامج التعليمي أفكار تجسيد مخازن البيانات وكيفية تأثيرها على أداء DAX ​​في توفير النتائج.

إعداد تقارير الأعمال باستخدام LuckyTemplates

إعداد تقارير الأعمال باستخدام LuckyTemplates

إذا كنت لا تزال تستخدم Excel حتى الآن ، فهذا هو أفضل وقت لبدء استخدام LuckyTemplates لاحتياجات إعداد تقارير الأعمال الخاصة بك.

ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته

ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته

ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته