ما هي الذات في بايثون: أمثلة من العالم الحقيقي
ما هي الذات في بايثون: أمثلة من العالم الحقيقي
ستوضح هذه المدونة كيفية استخدام مخطط التوزيع التراكمي ، والمعروف أيضًا باسم دالة التوزيع التراكمي التجريبية أو مخططات ECDF ، وتعرض مزايا استخدام هذا التباين في المؤامرة على أنواع المؤامرات الأخرى. يمكنك مشاهدة الفيديو الكامل لهذا البرنامج التعليمي أسفل هذه المدونة .
يفضل معظم الأشخاص مخططات ECDF على لتصور البيانات أثناء قيامهم برسم كل نقطة بيانات مباشرة ، وهذه الميزة تجعل من السهل على المستخدم التفاعل مع المؤامرة. اليوم ، ستتعلم كيفية استخدام ECDF في Python و LuckyTemplates وتحسين العروض التقديمية والتقارير حول توزيع البيانات.
جدول المحتويات
أنواع قسائم التوزيع
سأبدأ بتصفية بياناتي في يوم معين ، السبت ، ويمكننا أن نرى أدناه كل مخططات بايثون المستخدمة لوصف التوزيعات. لدينا هنا مخطط ECDF الخاص بنا ، والمدرج التكراري ، ومؤامرة كيدي ، ومخطط الصندوق.
ستصف كل هذه المؤامرات كيفية انتشار البيانات أو توزيعها. على سبيل المثال ، إذا نزلنا ونظرنا إلى المدرج التكراري ، يمكننا أن نرى أن معظم هذه الصناديق الطويلة ستكون حيث توجد بياناتنا.
عند حوالي 3.50 دولارًا أمريكيًا ، لدينا أعلى حاوية لبيانات النصائح الخاصة بنا في مجموعة البيانات أدناه.
يمكننا أيضًا استخدام مخطط كيدي الذي يعطينا مقياسًا مختلفًا عند النظر إلى التوزيع. يتعامل المدرج التكراري مع العدد الذي سيكون في هذه الصناديق ، بينما تتعامل KDE مع الكثافة.
باستخدام مخطط KDE ، يمكنك معرفة مكان وجود معظم بياناتنا من خلال تحديد أكبر كثافة أو أعلى انتفاخ في قطعة الأرض إذا صح التعبير. لذلك في الصورة أعلاه ، يمكننا القول أنها موزعة في مكان ما بين دولارين و 4 دولارات.
وينطبق الشيء نفسه في مخطط Box ، والذي يوضح أن التوزيع يتراوح بين 2 و 4 دولارات ، وهذا هو المكان الذي ستكون فيه معظم بياناتنا. يستخدم الوسيط ، الخط الأفقي الذي يقسم المربع ، ليعطينا فكرة عن مكان التوزيع الأكبر.
وبعد ذلك ، لدينا مخطط ECDF حيث على الجانب الأيسر من المحور y ، يمكنك رؤية كلمة نسبة ، التي تمثل النسب المئوية لدينا. بناءً على المؤامرة ، عند 3.50 دولارًا ، ننظر إلى حوالي 50 ٪ من بياناتنا ، و 5 دولارات وما دونها حيث يتم توزيع 80 ٪ من بياناتنا.
رمز رسم الرسم البياني
الآن سوف أريكم الكود الخاص بكل واحدة من هذه المؤامرات ، بدءاً من الرسم البياني. لديهم جميعًا ترميزًا متشابهًا للغاية وقابل للتكرار ، لذا يمكنك سحبها سريعًا باستخدام رمز واحد ، مثل القالب.
نحتاج أولاً إلى استيراد Seaborn وحفظه كـ sb ، متبوعًا بـ matplotlib.pyplot كـ plt. سنستخدم نمط خلفية يسمى ggplot ومتغير matplotlib لتمرير أنماط مختلفة.
على سبيل المثال ، في الصورة أدناه ، يمكننا أن نرى أنه في السطر الحادي عشر ، نضيف عنوانًا للمدرج التكراري وأحجام التجزئة في الأسطر التالية. يمثل yticks و xticks أحجام x و y وفقًا لذلك .
في السطر الرابع عشر ، نستخدم متغير Seaborn لتمرير الوظيفة التي تجلب تلك المؤامرة المعينة ، مثل الرسم البياني في المثال أعلاه ، والذي يمثل مؤامرة مدرج تكراري. ثم نقوم بتمرير البيانات من السطر الرابع إلى الوظيفة كمجموعة بيانات.
أي شيء تحضره في القيم يمثل مجموعة البيانات الخاصة بك وسوف يسقط التكرارات. ثم سنستخدم x للنصائح ، ودرجة اللون ، والتي ، جنبًا إلى جنب مع seaborn ، تسمح لك بفصل بياناتك حسب الفئة. إذا عدنا إلى الصورة المرئية الخاصة بنا ، فيمكننا أن تحتوي على فئات ، بما في ذلك الوقت ، أو المدخن.
مؤامرة كيدي
بالنسبة لمؤامرة كيدي ، كل شيء متطابق تقريبًا. نحتاج فقط إلى تمرير معلمة جديدة تسمى الظل للحصول على هذا المظهر المظلل. بخلاف ذلك ، فإن اللون والبيانات والباقي هي نفسها.
مع مؤامرة Box ، فإنها تشبه في الغالب المؤامرات الأخرى باستثناء بعض الاختلافات الطفيفة. هنا نستخدم دالة boxplot حيث x هو اليوم و y هي النصائح. نحن أيضًا لا نستخدم الصبغة لهذه المؤامرة.
لذلك فهو نفس هيكل مخطط ECDF والفرق الوحيد هو في متغير Seaborn ، حيث نمرر في مخطط ECDF ونستخدم تدرج اللون في اليوم. ولكن يمكننا أيضًا تغيير هذا اللون إلى فئة أخرى لدينا ، مثل المدخن.
إذا مررنا هذه الفئة ، فسننتهي بمخطط ECDF الذي يحتوي على سطرين مختلفين. في هذه التوزيعات ، يمكننا أن نرى أن المدخنين لديهم المزيد فيما يتعلق بعرض خطنا المحدد.
لدى غير المدخنين مائة بالمائة من تلك البيانات أقل من 6 دولارات ، بينما يحصل عليها المدخنون على 6 دولارات. ومن المثير للاهتمام ، أن مدخنينا قد يتركون بقشيشًا أكبر في يوم معين.
مؤامرات التصميم ECDF
الآن يمكننا تصميم مخططات ECDF لجعلها أكثر روعة. في الصورة أدناه مؤامرات مختلفة من ECDF. في المخطط الأول ، قمت بتكبير الخطوط واستخدمت لوحة ألوان مختلفة.
في المخطط الأول ، استخدمت معلمات مختلفة داخل الوظيفة. كما ترون أدناه ، مررت في اللوحة في الصيف وعرض الخط 5.
لقد قارنت أيضًا يومي السبت والأحد ، ولهذا السبب يوجد خطان أخضران مختلفان. هنا يمكننا أن نرى أن الإكرامية البالغة 3 دولارات تقع عند 45 بالمائة ليوم الأحد و 70 بالمائة ليوم الخميس ، مما يخبرنا أن الناس يميلون إلى ترك إكراميات أعلى يوم الأحد.
يمكننا أيضًا تبديل المحور X و Y ، ومبادلة النسبة والقلب داخل مخططنا ، وتغيير اللوحة ، تمامًا كما في الصورة أدناه.
هنا يمكننا أن نرى أن البقشيش بقيمة 2 دولار يقع عند النسبة المئوية العشرين ليوم الأحد ، وهو الخط الأرجواني في الرسم البياني. لذا فإن البيانات هي نفسها مع مؤامرة ECDF السابقة ولا يختلف سوى العرض التقديمي.
لدينا الآن مخطط آخر بنفس مجموعة البيانات ونحتفظ بمواضع المحور الأصلية كما هو موضح في الصورة أعلاه. الفرق هذه المرة هو أن اتجاه الخطوط معكوس.
نمط قطع ECDF
إذا نظرنا إلى الكود ، فكل ما نفعله هو تمرير المعامل التكميلي يساوي = صحيح. سيسمح لنا هذا الإجراء بالقول إنه في النطاق 2 دولار وما فوق هو المكان الذي يتم فيه توزيع 80 ٪ من بياناتنا ، بدلاً من القول أن النطاق أقل من 2 دولار هو المكان الذي يتم فيه توزيع 20 ٪ من بياناتنا. مرة أخرى ، إنها نفس البيانات بمظهر أو طريقة مختلفة لتقديمها.
وفي مؤامرة ECDF الرابعة والأخيرة ، نستخدم Count بدلاً من التناسب.
هذا النهج مفيد عندما يكون لدينا أكثر من عدد قليل من المؤامرات. من خلال النظر إلى عمود العد في الصورة أدناه ، يمكننا أن نرى أنه لا يوجد الكثير من الملاحظات يوم الجمعة ، مما يخبرنا أن الناس لا يتركون الكثير من النصائح في ذلك اليوم.
أساسيات كود قطع الأرض ECDF
إذا نظرنا إلى الكود ، ستجد Seaborn ، وهو الشيء الرئيسي لإنشاء هذه المؤامرة بالذات. لدينا أيضًا matplotlib.pyplot للتصميم ، والذي يمكنك حفظه كمتغير يسمى plt .
يمكننا بعد ذلك استخدام هذا المتغير لإنشاء أنماط مختلفة لمؤامرة معينة ، مثل إضافة العناوين وأحجام الخطوط. سيكون الجزء الرئيسي من الكود الخاص بك هو وظيفة مؤامرة ECDF التي نحضرها مع Seaborn.
مخطط المبعثر في البرنامج النصي R: كيفية إنشاء واستيراد
الدوال المحددة بواسطة مستخدم Python | نظرة عامة على
GGPLOT2 In R: المرئيات مع ESQUISSE
خاتمة
كانت تلك هي الطرق التي يمكنك من خلالها استخدام مخططات التوزيع المختلفة ، بما في ذلك مخططات الرسم البياني و KDE و Box و ECDF. لق�� تعلمت أيضًا أربع طرق لتقديم مخطط ECDF باستخدام نفس مجموعة البيانات. يمكنك استخدام أي نهج حسب تفضيلاتك.
تذكر دائمًا إحضار المكتبات اللازمة لإنشاء قطعة الأرض الخاصة بك واستخدام الوظيفة الصحيحة. بعد ذلك ، يتعلق الأمر فقط بتغيير الجوانب المرئية والأسلوبية لمخططك مثل موضع المحور والأشكال.
أتمنى لك كل خير،
ما هي الذات في بايثون: أمثلة من العالم الحقيقي
ستتعلم كيفية حفظ وتحميل الكائنات من ملف .rds في R. ستغطي هذه المدونة أيضًا كيفية استيراد الكائنات من R إلى LuckyTemplates.
في هذا البرنامج التعليمي للغة ترميز DAX ، تعرف على كيفية استخدام وظيفة الإنشاء وكيفية تغيير عنوان القياس ديناميكيًا.
سيغطي هذا البرنامج التعليمي كيفية استخدام تقنية Multi Threaded Dynamic Visuals لإنشاء رؤى من تصورات البيانات الديناميكية في تقاريرك.
في هذه المقالة ، سأقوم بتشغيل سياق عامل التصفية. يعد سياق عامل التصفية أحد الموضوعات الرئيسية التي يجب على أي مستخدم LuckyTemplates التعرف عليها في البداية.
أريد أن أوضح كيف يمكن لخدمة تطبيقات LuckyTemplates عبر الإنترنت أن تساعد في إدارة التقارير والرؤى المختلفة التي تم إنشاؤها من مصادر مختلفة.
تعرف على كيفية إجراء تغييرات في هامش الربح باستخدام تقنيات مثل قياس التفرع والجمع بين صيغ DAX في LuckyTemplates.
سيناقش هذا البرنامج التعليمي أفكار تجسيد مخازن البيانات وكيفية تأثيرها على أداء DAX في توفير النتائج.
إذا كنت لا تزال تستخدم Excel حتى الآن ، فهذا هو أفضل وقت لبدء استخدام LuckyTemplates لاحتياجات إعداد تقارير الأعمال الخاصة بك.
ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته