مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

في هذه المدونة ، ستتعلم كيفية تطبيق الأكواد أو الوظائف القابلة للتكرار على مجموعات بيانات Python لإنتاج نفس النوع من المخرجات. سيساعدك هذا على أن تكون أكثر كفاءة وبذل جهد أقل في سحب بيانات معينة من مجموعات بيانات مختلفة. في هذا البرنامج التعليمي ، سنستخدم رمزًا موجودًا قمت بإنشائه مسبقًا كمثال.

ستتعلم أيضًا كيفية عمل نسخ من مجموعات البيانات لتجنب إتلاف الإصدار الأصلي من مجموعة البيانات ، واستيراد المكتبات والوظائف باستخدام أكواد قابلة للتكرار ، وإنشاء تصور في LuckyTemplates .

بالنسبة لهذه المدونة ، أوصيك بالحصول على ملف CSV طوال الوقت وإحضاره إلى LuckyTemplates. سأوضح أيضًا كيف يمكننا إحضار ملف CSV هذا ووضعه مباشرة في LuckyTemplates ، فقط في حال اضطررت إلى القيام بذلك.

جدول المحتويات

إحضار ملف CSV في LuckyTemplates

لإحضار ملف CSV إلى LuckyTemplates ، فإن أول ما عليك فعله هو النقر على قائمة " الحصول على البيانات " في شريط الصفحة الرئيسية .

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

بعد النقر ، ستظهر قائمة منسدلة وعليك تحديد خيار " نص / CSV " من القائمة.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

بمجرد تحديد الخيار " نص / CSV " ، ستفتح نافذة حيث يمكننا تحديد الملف الذي نريد إحضاره إلى LuckyTemplates. في هذا المثال ، دعنا نستخدم ملف IMDB Dataset

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

عند فتح ملف IMDB Dataset.csv ، سترى نافذة أخرى تعرض البيانات داخل هذا الملف. نظرًا لأن هذا الملف يحتوي على كمية كبيرة من البيانات ، فإنه يقوم فقط بمعاينة بعض البيانات.

أول شيء سنفعله في هذا الملف هو تحويله. للقيام بذلك ، ما عليك سوى النقر فوق خيار " تحويل البيانات " في الجزء السفلي الأيمن من النافذة.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

عمل نسخة من مجموعة بيانات Python

قبل إجراء أي تغييرات على مجموعة البيانات هذه ، من المهم عمل نسخة من مجموعة البيانات الأصلية. للقيام بذلك ، ما عليك سوى النقر بزر الماوس الأيمن على مجموعة البيانات. 

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

ثم من القائمة ، حدد " نسخ ".

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

أخيرًا ، انقر بزر الماوس الأيمن على لوحة الاستعلامات ثم حدد " لصق " من الخيارات.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

بعد تطبيق هذه الخطوات ، يجب أن يكون لديك نسخة من مجموعة بيانات IMDB الأصلية في لوحة الاستعلامات .

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

تحويل مجموعة بيانات عن طريق تشغيل برنامج نصي بلغة بايثون

من خلال تحويل ملف CSV ، ستتمكن من تقسيم كميات كبيرة من مجموعات بيانات Python إلى مجموعات أصغر. يمكننا القيام بذلك عن طريق تطبيق بعض نصوص Python في هذا الملف.

لكن أولاً ، علينا التأكد من اصطفاف الرؤوس بشكل صحيح. انقر على القائمة الرئيسية ثم ابحث عن خيار " استخدام الصف الأول كرؤوس " وانقر فوقه.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

بعد النقر على خيار " استخدام الصف الأول كرؤوس " ، تغيرت الرؤوس الآن إلى البيانات من الصفوف الأولى السابقة وهي " مراجعة " و " شعور ".

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

بعد ذلك ، انتقل إلى قائمة التحويل وانقر على خيار " Run Python Script " في مجموعة خيارات " Scripts ".

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

بعد ذلك ، ستظهر نافذة " Run Python Script ". في هذه النافذة ، يمكنك تشغيل أي برنامج نصي من Python تريده لتحويل الملف الحالي الذي تستخدمه. في هذا المثال ، سأقوم بتصغير مجموعة البيانات عن طريق تشغيل الكود التالي.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

لقد استخدمت وظيفة .iloc في مجموعة البيانات لتحديد الصفوف والأعمدة المحددة من مجموعة بيانات IMDB. بعد ذلك ، في المعلمات ، حددت جميع الصفوف الـ 500 الأولى وجميع الأعمدة في مجموعة بيانات IMDB. لقد قمت بتخزينها في متغير يسمى " مجموعة البيانات ".

بعد تنفيذ البرنامج النصي ، يجب أن نرى "مجموعة البيانات" وهي المتغير الذي أنشأناه في الخطوة السابقة. يحتوي على البيانات التي قمنا بتعديلها باستخدام برنامج Python النصي.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

فحص مجموعة البيانات

لفتح جدول مجموعة البيانات ، ما عليك سوى النقر على " جدول " أسفل عمود القيمة .

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

يمكننا أن نرى أن مجموعة البيانات هذه قد تقلصت الآن إلى 500 صف .

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

الآن بعد أن قمنا بتقسيم مجموعة بيانات Python الخاصة بنا إلى 500 صف ، فإن الشيء التالي الذي سنفعله هو استيراد المكتبات التي نحتاجها. سنفعل ذلك باستخدام نفس الإجراء الذي قمنا به في تغيير محتويات مجموعة بيانات IMDB. هذا للتأكد من أن الكود الخاص بنا يمكن التحكم فيه في سيناريوهات معينة مع تعديلات أقل.

استيراد المكتبات والوظائف باستخدام أكواد قابلة للتكرار

لاستيراد المكتبات ، دعنا نعود إلى دفتر ملاحظاتنا وننسخ المكتبات التي نحتاجها. ضع في اعتبارك أنه قبل هذا البرنامج التعليمي ، قمت بالفعل بإنشاء هذه المكتبات التي نحن على وشك نسخها. أنا فقط أعيد استخدامها من أجلك للحصول على فكرة واضحة حول استخدام الوظائف كرموز قابلة للتكرار.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

بمجرد نسخ المكتبات ، قم بلصقها في نافذة " Run Python Script " ، ولا تنس تضمين السطر " from Collections import Counter " في نهاية البرنامج النصي. 

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

بعد ذلك سنقوم بنسخ وظيفة تنظيف البيانات من دفتر الملاحظات الخاص بنا وإضافتها إلى برنامج Python النصي في LuckyTemplates.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

سنقوم بإضافته أسفل المكتبات. 

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

سنقوم أيضًا بنسخ الكود لاستدعاء الوظيفة التي أضفناها للتو.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

ثم الصقه في نص Python النصي في LuckyTemplates.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

توليد جداول البيانات

الآن بعد أن أضفنا الكود لاستدعاء وظيفة تنظيف البيانات ، نحتاج إلى تغيير " df2 " إلى " مجموعة بيانات " و " العنوان " إلى " مراجعة ". لقد فعلنا ذلك بسبب التغييرات التي أجريناها على مجموعة البيانات.

قمنا بتغيير "df2" إلى " مجموعة البيانات " لأننا قمنا بتخزين البيانات مع 500 صف في "مجموعة البيانات". ثم بالنسبة إلى "العنوان" ، قمنا بتحديثه إلى "مراجعة" نتيجة لتغيير رؤوس الأعمدة.

مع إضافة هذه الرموز ، يجب أن نكون قادرين على الحصول على أو إنشاء 3 جداول وهي بيانات 1 لتردد الكلمات ، وبيانات 2 لتردد بيغرام ، وبيانات 3 لتردد تريجرام.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

يمكنك أيضًا عمل نسخة أخرى من مجموعة بيانات IMDB المعدلة (2) لفتح جدول آخر لاحقًا.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

الآن في IMDB Dataset (2) ، دعنا نفتح جدول data1

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

 بمجرد فتح جدول data1 ، يمكننا رؤية قائمة الكلمات بالإضافة إلى التكرار.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

كما ترى ، نحن قادرون على تنفيذ إجراءات معينة من مجموعة البيانات الرئيسية باستخدام الرموز القابلة للتكرار التي أخذناها من Jupyter Notebook. باستخدام هذه الرموز القابلة للتكرار ، يمكننا تحويل مجموعة بيانات Python وإنشاء جدول لتردد الكلمات ، وتكرار Bigram ، وتردد المثلثات دون كتابة الرموز مرة أخرى.

في IMDB Dataset (3) ، دعنا نفتح جدول data2 لرؤية تردد bigram.

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار

في جدول تردد Bigram ، يمكنك رؤية " br " مدرج في القائمة. ربما يكون هذا مرتبطًا برمز HTML. يمكننا ببساطة العودة وإضافة شيء آخر ولكننا لن نفعل ذلك في هذا البرنامج التعليمي.

الآن بعد أن تم تحميل البيانات بمساعدة الرموز القابلة للتكرار ، يمكننا البدء في عمل تصورات عنها في LuckyTemplates. على سبيل المثال ، رسم بياني شريطي لتكرار كل كلمة. 

مجموعة بيانات Python: تطبيق الرموز القابلة للتكرار


وظائف محددة من قبل مستخدم Python | نظرة عامة على
قائمة Python وللحلقات في LuckyTemplates
باستخدام Python في LuckyTemplates | وظيفة مجموعة البيانات والسلسلة

خاتمة

باختصار ، يمكن أن تساعدك الرموز القابلة للتكرار في تنفيذ إجراءات معينة على مجموعة بيانات بجهد أقل. لقد تعلمت كيفية استخدام الأكواد القابلة للتكرار لتحويل مجموعة بيانات Python في LuckyTemplates. كنت أيضًا قادرًا على استخدام وظيفة .iloc لتحديد الصفوف والأعمدة التي سيتم تحديدها في تعديل مجموعة البيانات.

بالإضافة إلى ذلك ، قمت بإنشاء نسخ من مجموعات البيانات وإنشاء تصور باستخدام الرسم البياني الشريطي. يعتمد هذا التصور على مجموعات بيانات Python التي أنشأناها وعدلناها بمساعدة الأكواد القابلة للتكرار.

أتمنى لك كل خير،

غيليم

Leave a Comment

تقنية تصور LuckyTemplates: تعرف على كيفية إنشاء لوحات تصميم الخلفية

تقنية تصور LuckyTemplates: تعرف على كيفية إنشاء لوحات تصميم الخلفية

تعرف على تقنية تصور LuckyTemplates هذه حتى تتمكن من إنشاء قوالب الخلفية واستيرادها إلى تقارير LuckyTemplates الخاصة بك.

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

كيفية حفظ وتحميل ملف RDS في R.

كيفية حفظ وتحميل ملف RDS في R.

ستتعلم كيفية حفظ وتحميل الكائنات من ملف .rds في R. ستغطي هذه المدونة أيضًا كيفية استيراد الكائنات من R إلى LuckyTemplates.

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

في هذا البرنامج التعليمي للغة ترميز DAX ، تعرف على كيفية استخدام وظيفة الإنشاء وكيفية تغيير عنوان القياس ديناميكيًا.

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

سيغطي هذا البرنامج التعليمي كيفية استخدام تقنية Multi Threaded Dynamic Visuals لإنشاء رؤى من تصورات البيانات الديناميكية في تقاريرك.

مقدمة لتصفية السياق في LuckyTemplates

مقدمة لتصفية السياق في LuckyTemplates

في هذه المقالة ، سأقوم بتشغيل سياق عامل التصفية. يعد سياق عامل التصفية أحد الموضوعات الرئيسية التي يجب على أي مستخدم LuckyTemplates التعرف عليها في البداية.

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أريد أن أوضح كيف يمكن لخدمة تطبيقات LuckyTemplates عبر الإنترنت أن تساعد في إدارة التقارير والرؤى المختلفة التي تم إنشاؤها من مصادر مختلفة.

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تعرف على كيفية إجراء تغييرات في هامش الربح باستخدام تقنيات مثل قياس التفرع والجمع بين صيغ DAX في LuckyTemplates.

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

سيناقش هذا البرنامج التعليمي أفكار تجسيد مخازن البيانات وكيفية تأثيرها على أداء DAX ​​في توفير النتائج.

إعداد تقارير الأعمال باستخدام LuckyTemplates

إعداد تقارير الأعمال باستخدام LuckyTemplates

إذا كنت لا تزال تستخدم Excel حتى الآن ، فهذا هو أفضل وقت لبدء استخدام LuckyTemplates لاحتياجات إعداد تقارير الأعمال الخاصة بك.