ما هي الذات في بايثون: أمثلة من العالم الحقيقي
ما هي الذات في بايثون: أمثلة من العالم الحقيقي
عند العمل مع مجموعة بيانات تتكون من متغيرات متعددة ، من الأفضل أن تكون قادرًا على فهم كيفية اختلاف هذه المتغيرات وتفاعلها مع بعضها البعض. في هذا البرنامج التعليمي ، سأوضح كيف يمكنك استخدام وظيفة Seaborn في Python لتصور بدائل لتوزيع المتغير. يمكنك مشاهدة الفيديو الكامل لهذا البرنامج التعليمي أسفل هذه المدونة.
جدول المحتويات
استخدام وظيفة Seaborn في لغة بايثون
سأوضح هذا في مجموعة بيانات MPG ، والمتاحة داخل Seaborn. لذلك ، دعنا نمضي قدمًا ونستورد أي حزم نحتاجها بالإضافة إلى أي بيانات نحتاجها. سنلقي نظرة على توزيع متغير MPG هنا وكيف يختلفون. الطريقتان الشائعتان للقيام بذلك هما المدرج التكراري و boxplot .
لذلك سأستخدم دالة التوزيع (DIS للتوزيع). بعد ذلك ، أحتاج إلى تحديد مجموعة البيانات التي هي والمتغير الذي سنضعه على المحور السيني. وبهذا يكون لدينا التوزيع.
هذا جيد جدا. من السهل جدًا رؤية التوزيع والشكل بالكامل. ومع ذلك ، هناك بعض أوجه القصور في هذا التصور للتوزيع. الأول هو أن عدد الحاويات التي نستخدمها عشوائي. الشيء الآخر هو أننا لا نستطيع بالضرورة أن نعرف على الفور معنى المتغير.
الشيء الجميل في Seaborn هو أنه بمجرد أن أقوم بإعداد المتغير الذي أريده ، وأين ، وما هي مجموعة البيانات التي أستخدمها ، فإن الأمر يتعلق حقًا بعمل تصور جديد. الآن سنذهب إلى boxplot. Boxplot لا يستخدم الصناديق.
الفكرة هنا هي أنه يمكننا رؤية القيمة الربعية بوضوح حقًا ، والوسيط تحديدًا ، ونرى القيم الربعية الأخرى. نرى أن هناك شاذة ، وهذه مؤامرة دقيقة للغاية. مشكلة boxplot هي أنها دقيقة مع الأشياء التي لا يهتم بها الكثير من مستخدمي الأعمال بشكل عام.
لذلك ، هذه الحبكة صعبة بعض الشيء على الأشخاص غير الإحصائيين للحصول على الكثير من القيمة حقًا. ومرة أخرى ، إنها تجمع البيانات ، لذلك نفقد الكثير من التفاصيل. من الصعب أن تعرف بالضبط كيف يبدو هذا. يمكننا أن نرى أن هناك شاذة. يمكننا أن نرى معظم القيم هنا. يمنحنا المدرج التكراري طريقة أكثر سهولة للنظر إلى ذلك.
كلاهما مؤامرات جيدة. كلاهما له أغراضه الخاصة. دعونا نلقي نظرة على بعض البدائل باستخدام Seaborn للتخيل. سنلتزم MPG لتوزيع هذا المتغير.
على غرار boxplot ، يمكنك أن ترى هنا أن الوسيط محدد بوضوح. نرى النطاق الربعي أيضًا ويمكننا إلقاء نظرة أفضل على ماهية التوزيع الكلي. هذا يشبه المدرج التكراري أيضًا. يطلق عليه مخطط تقدير كثافة النواة أو مخطط كيدي. إنها نسخة سلسة من المدرج التكراري. نحن لا نستخدم أي تجميع عشوائي. كل شيء يتم تجانسه في نطاق مستمر هنا.
هذا نوع من مزيج من هذين النهجين ويهتم حقًا ببعض أوجه القصور. ومع ذلك ، اعتمادًا على جمهورك ، قد يواجهون صعوبة في النظر إلى هذا الأمر. قد لا يتم استخدامها ، ولكن لها بعض الفوائد للطرق التقليدية.
في هذا النهج ، لم نعد نجمع البيانات. يتم رسم كل نقطة فردية. هذا يأخذ عناصر من مخطط التشتت ، أليس كذلك؟ إذا كنت تفكر في مخطط مبعثر ، فإننا نرسم كل نقطة فردية على إحداثيات X و Y.
أخيرًا ، لدينا التعري . ما نفعله هنا هو أخذ هذا التوزيع ونحن نشتت عشوائيًا. هذه عملية عشوائية. نحن لا نحاول أن نجعل شكل التوزيع هذا بعد الآن. تكمن المشكلة في هذا في أن لدينا كل هذه الكتل تصطدم ببعضها البعض ، لذلك قد لا يكون ذلك جيدًا اعتمادًا على ما تحاول القيام به. ربما تريد تلوينها حسب المجموعة أو شيء من هذا القبيل ، لذلك هناك خيار لذلك.
يمكننا تغيير الارتعاش إلى 0.25 ونرى أنه كلما زاد التوتر ، تنتشر هذه النقاط أكثر قليلاً.
ومع ذلك ، في كل مرة أقوم بتشغيلها ، ستبدو مختلفة قليلاً. لذا ، إذا كنت تريد التخلص من ذلك وجعله كما هو في كل مرة ، يمكنك استيراد numpy كـ np . ما يفعله هذا هو ما يسمى إعداد بذرة عشوائية.
في كل مرة أقوم بتشغيل شيء له علاقة بأرقام عشوائية ، سيستخدم نفس الأرقام العشوائية. لا تتغير الأشياء بشكل عشوائي عند إعادة تشغيلها. قد يكون هذا جيدًا لأي نوع من المحاكاة التي تقوم بها ، والتي تحدث كثيرًا في علم البيانات والتحليلات مع هذا التصور أيضًا. لذا الآن ، في كل مرة أقوم فيها بتشغيل هذه الحبكة ، سنحصل على نفس الشكل من ذلك.
يمكنني أيضًا إضافة أصل Y هنا ، والآن نرى أننا ننشئ توزيعًا ثنائي المتغير. نحن نأخذ توزيع الأميال ونقسمها حسب الأصل.
كيفية استخدام Python Script في LuckyTemplates
Python Scripting في
مجموعات بيانات تقارير بيانات LuckyTemplates في Pandas مع ProfileReport () | بايثون في LuckyTemplates
خاتمة
هذه بدائل لتصور توزيعات متغير واحد. لديهم كل مزاياها وعيوبها. هذا لا يعني ، لا تستخدم أبدًا مخطط الصندوق أو المدرج التكراري ، ولكنه يقول فقط ، إليك بعض الخيارات الأخرى ، اعتمادًا على ما تحاول إظهاره.
من السهل جدًا صنعها تمامًا مثل أي من الأنواع الأخرى عندما نستخدم وظيفة Seaborn في Python. إذا كنت تريد معرفة المزيد عن Python ، فراجع الروابط أدناه.
أتمنى لك كل خير!
ما هي الذات في بايثون: أمثلة من العالم الحقيقي
ستتعلم كيفية حفظ وتحميل الكائنات من ملف .rds في R. ستغطي هذه المدونة أيضًا كيفية استيراد الكائنات من R إلى LuckyTemplates.
في هذا البرنامج التعليمي للغة ترميز DAX ، تعرف على كيفية استخدام وظيفة الإنشاء وكيفية تغيير عنوان القياس ديناميكيًا.
سيغطي هذا البرنامج التعليمي كيفية استخدام تقنية Multi Threaded Dynamic Visuals لإنشاء رؤى من تصورات البيانات الديناميكية في تقاريرك.
في هذه المقالة ، سأقوم بتشغيل سياق عامل التصفية. يعد سياق عامل التصفية أحد الموضوعات الرئيسية التي يجب على أي مستخدم LuckyTemplates التعرف عليها في البداية.
أريد أن أوضح كيف يمكن لخدمة تطبيقات LuckyTemplates عبر الإنترنت أن تساعد في إدارة التقارير والرؤى المختلفة التي تم إنشاؤها من مصادر مختلفة.
تعرف على كيفية إجراء تغييرات في هامش الربح باستخدام تقنيات مثل قياس التفرع والجمع بين صيغ DAX في LuckyTemplates.
سيناقش هذا البرنامج التعليمي أفكار تجسيد مخازن البيانات وكيفية تأثيرها على أداء DAX في توفير النتائج.
إذا كنت لا تزال تستخدم Excel حتى الآن ، فهذا هو أفضل وقت لبدء استخدام LuckyTemplates لاحتياجات إعداد تقارير الأعمال الخاصة بك.
ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته