كيفية تحميل عينة من مجموعات البيانات في بايثون

كيفية تحميل عينة من مجموعات البيانات في بايثون

في هذا المنشور ، سنلقي نظرة على كيفية تحميل عينات مجموعات البيانات في Python. قد لا يبدو هذا الموضوع الأكثر سحرًا ، لكنه في الواقع مهم جدًا. من الناحية المثالية ، سيكون لديك بعض مجموعات البيانات في Python التي يمكنك التدرب عليها عندما تتعلم مفاهيم جديدة. يمكنك مشاهدة الفيديو الكامل لهذا البرنامج التعليمي أسفل هذه المدونة.

إذا كنت ستشارك التعليمات البرمجية الخاصة بك ، أو توثق ما قمت به ، أو تحتاج إلى مساعدة ، فمن الجيد حقًا استخدام مجموعة بيانات متاحة بشكل عام لبناء شيء ما يسمى بالمثال الأقل تكرارًا .

سيكون لديك رمز أو نص برمجي مجمّع مسبقًا يمكن لأي شخص آخر على الإنترنت تشغيله ومساعدتك في ذلك. إذا لم تقم بإنتاج هذه الأمثلة القابلة للتكرار بالحد الأدنى ، فستتألق في أماكن مثل Stack Overflow ، والتي يمكن أن تكون صدمة إذا لم تكن معتادًا عليها.

كيفية تحميل عينة من مجموعات البيانات في بايثون

دعنا نلقي نظرة على بعض الطرق لبناء هذه الأمثلة القابلة للتكرار بالحد الأدنى والحصول على مجموعات البيانات. هناك عدد قليل من الحزم التي يمكنك استخدامها لتحميل مجموعة بيانات معدة مسبقًا في Python ومشاركة هذا الرمز.

سننظر في ثلاث حزم هي الأكثر شيوعًا. دعنا نشعل دفتر Jupyter فارغ ونبدأ.

كيفية تحميل عينة من مجموعات البيانات في بايثون

جدول المحتويات

قم بتحميل مجموعات البيانات في Python من Sklearn

أول ما سننظر إليه هو Sklearn . إذا كنت تستخدم Anaconda ، فلن تحتاج إلى تنزيل هذا. إذا كنت ترغب في مزيد من المساعدة مع Python ، فإن LuckyTemplates لديها التي يمكنك التسجيل فيها.

سأفترض أنك تعرف بالفعل أشياء مثل الحزم ، وانطلق من هناك. سنقوم بإحضار الباندا و Sklearn ، وتحديدا الوحدة الفرعية لمجموعة البيانات.

كيفية تحميل عينة من مجموعات البيانات في بايثون

سنقوم بإحضار عدد قليل من مجموعات البيانات هذه. Scikit-Learn - مكتبة بيانات التعلم الآلي - تسميها مجموعات بيانات الألعاب. سنقوم بتحميل بوسطن ، وهي مجموعة بيانات أسعار المساكن. عندما نقوم بإدخال هذا ، نحتاج إلى الحصول عليه كإطار بيانات.

نحتاج بالفعل إلى تحديد أن البيانات والأعمدة تأتي من مجموعة بيانات Scikit-Learn ، ونفصل بين متغيرات الميزة والمتغيرات الهدف.

كيفية تحميل عينة من مجموعات البيانات في بايثون

سنقوم بإدخال هذا كإطار بيانات حتى نتمكن من العمل والقيام بأشياء مختلفة باستخدامه. Panda هي حزمة رائعة يجب معرفتها كمستخدم LuckyTemplates.

قم بتحميل مجموعات البيانات في Python من مجموعات بيانات Vega

هناك خيار آخر يمكننا تعلمه وهو حزمة مجموعات بيانات Vega. هذا غير متوفر على Anaconda ولكن يمكننا تثبيته من خلال PIP. هذا ما سنكتبه في سطر الأوامر لتثبيت مجموعات بيانات Vega ولتثبيت أو استيراد وحدة البيانات المحلية.

كيفية تحميل عينة من مجموعات البيانات في بايثون

يمكنك الحصول على بعض هذه الأشياء بالفعل ، لكنك ستحتاج إلى اتصال بالويب. سنقوم بإحضار تلك التي تم تثبيتها محليًا عن طريق استيراد البيانات المحلية وتشغيلها.

كيفية تحميل عينة من مجموعات البيانات في بايثون

كما ترى ، هناك عدد غير قليل من مجموعات البيانات. بعضها عبارة عن سلاسل زمنية ، بينما يحتوي بعضها على متغيرات فئوية أو مستمرة. دعنا نختار مجموعة بيانات السيارات في إطار بيانات حتى نتمكن من تشغيل طريقة الرأس عليها.

كيفية تحميل عينة من مجموعات البيانات في بايثون

الآن ، لدينا مجموعة بيانات نموذجية أخرى يمكننا استخدامها ومشاركتها.

كيفية تحميل عينة من مجموعات البيانات في بايثون

قم بتحميل مجموعات البيانات في Python من Seaborn

Seaborn هي حزمة أخرى متوفرة في توزيع Anaconda. بشكل افتراضي ، تشتهر Seaborn بتصور البيانات ، ولكنها تحتوي أيضًا على بعض مجموعات البيانات النموذجية الرائعة التي يمكنك استخدامها. هذا ما سنكتبه للحصول على مجموعات البيانات.

كيفية تحميل عينة من مجموعات البيانات في بايثون

كما ترى ، هناك عدد غير قليل من مجموعات البيانات هنا. سنمضي قدمًا ونستخدم مجموعة بيانات طيور البطريق ونحصل على الصفوف القليلة الأولى مرة أخرى.

كيفية تحميل عينة من مجموعات البيانات في بايثون

والنتيجة هي مجموعة بيانات أخرى لنتدرب عليها.

كيفية تحميل عينة من مجموعات البيانات في بايثون

الفكرة هنا ليست مجرد امتلاك مجموعات البيانات للتدرب عليها. إذا رأينا بعض القيم المفقودة ، أو واجهتنا مشكلة في إسقاط مجموعات البيانات ، أو الرغبة في ملء المتغير الفئوي أو عرض مثال لأشخاص آخرين دون إعطاء بعض البيانات الحساسة ، فيمكنك فقط استخدام واحدة من مجموعات البيانات المتاحة للجمهور والتي تعتبر سهلة حقًا ليستخدمها الناس ويشاركونها. هذه هي فكرة مثال قابل للتكرار بالحد الأدنى.

LuckyTemplates مع برمجة Python لإنشاء جداول التاريخ
Python في LuckyTemplates: كيفية تثبيت Python I وإعداده
لمستخدمي LuckyTemplates - دورة تدريبية جديدة في النظام الأساسي التعليمي LuckyTemplates

خاتمة

للتلخيص ، هناك ثلاثة أماكن للبحث عن مجموعات بيانات نموذجية. Scikit-Learn هي حزمة تعلم الآلة. يصعب التحويل قليلاً ، ولكن إذا كنت تقوم بأشياء تتعلق بالتعلم الآلي ، فهذا هو المكان المناسب لك. تحتوي مجموعات بيانات Vega أيضًا على عدد لا بأس به من مجموعات البيانات خاصة إذا كنت تستخدم الطريقة للحصول على مجموعات البيانات من الويب ولكن يصعب تحميلها نسبيًا لذا عليك فقط استخدام PIP مقابل تثبيتها مسبقًا مع Anaconda. Seaborn هو المكان المثالي لأنه يقوم بتحميل إطار البيانات ولديه الكثير من التنوع عندما يتعلق الأمر باستخدام مجموعات البيانات النموذجية والأمثلة القابلة للتكرار.

يحتوي Stack Overflow أيضًا على برنامج تعليمي حول كيفية كتابة مثال جيد قابل للتكرار أو تعليم مخاطر الألغام ، لذا تحقق من ذلك إذا كنت تبحث عن نشر شيء ما عبر الإنترنت.

إن معرفة مكان الحصول على مجموعات بيانات جيدة ومشاركة التوعية الجيدة بمخاطر الألغام هي مهارة مهمة حقًا يجب أن تمتلكها كمحلل.

إذا كنت قد استمتعت بالمحتوى المغطى في هذا البرنامج التعليمي المحدد ، فيرجى الاشتراك في قناة LuckyTemplates التلفزيونية. لدينا قدر هائل من المحتوى يصدر طوال الوقت مني ومن مجموعة من منشئي المحتوى - وكلهم مكرسون لتحسين طريقة استخدامك لـ LuckyTemplates ومنصة Power.


ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

كيفية حفظ وتحميل ملف RDS في R.

كيفية حفظ وتحميل ملف RDS في R.

ستتعلم كيفية حفظ وتحميل الكائنات من ملف .rds في R. ستغطي هذه المدونة أيضًا كيفية استيراد الكائنات من R إلى LuckyTemplates.

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

في هذا البرنامج التعليمي للغة ترميز DAX ، تعرف على كيفية استخدام وظيفة الإنشاء وكيفية تغيير عنوان القياس ديناميكيًا.

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

سيغطي هذا البرنامج التعليمي كيفية استخدام تقنية Multi Threaded Dynamic Visuals لإنشاء رؤى من تصورات البيانات الديناميكية في تقاريرك.

مقدمة لتصفية السياق في LuckyTemplates

مقدمة لتصفية السياق في LuckyTemplates

في هذه المقالة ، سأقوم بتشغيل سياق عامل التصفية. يعد سياق عامل التصفية أحد الموضوعات الرئيسية التي يجب على أي مستخدم LuckyTemplates التعرف عليها في البداية.

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أريد أن أوضح كيف يمكن لخدمة تطبيقات LuckyTemplates عبر الإنترنت أن تساعد في إدارة التقارير والرؤى المختلفة التي تم إنشاؤها من مصادر مختلفة.

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تعرف على كيفية إجراء تغييرات في هامش الربح باستخدام تقنيات مثل قياس التفرع والجمع بين صيغ DAX في LuckyTemplates.

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

سيناقش هذا البرنامج التعليمي أفكار تجسيد مخازن البيانات وكيفية تأثيرها على أداء DAX ​​في توفير النتائج.

إعداد تقارير الأعمال باستخدام LuckyTemplates

إعداد تقارير الأعمال باستخدام LuckyTemplates

إذا كنت لا تزال تستخدم Excel حتى الآن ، فهذا هو أفضل وقت لبدء استخدام LuckyTemplates لاحتياجات إعداد تقارير الأعمال الخاصة بك.

ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته

ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته

ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته