ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

هذا البرنامج التعليمي هو استمرار للمناقشة حول حزمة dplyr . ستتعلم كيفية ترتيب الصفوف وتصفيتها وتجميعها في R.

كان الدرس السابق حول عمليات العمود. هذه المرة ، سيكون التركيز على عمليات الصفوف في dplyr .

سنغطي الأساسيات التي تتضمن فرز مجموعة بيانات وتصفيتها وتجميع السجلات وتلخيصها . لإعطائك نظرة عامة حول ما يمكن توقعه في هذا الدرس ، فكر في جدول محوري في MS Excel.

جدول المحتويات

ابدء

افتح برنامج نصي R جديد في RStudio.

على غرار درس عمليات العمود ، سيستخدم هذا العرض التوضيحي حزمة مجموعة بيانات Lahman . قم بتنزيله عن طريق إجراء بحث سريع على google.

لإحضار حزمة ليمان إلى R ، قم بتشغيل مكتبة (Lahman) . لتمكين حزمة dplyr ، قم بتشغيل مكتبة (tidyverse) . تذكر أيضًا أن أفضل ممارسة لاتفاقيات التسمية في R هي استخدام الأحرف الصغيرة ، لذا قم بتعيين Teams في فرق .

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

الوظائف الأساسية لعمليات الصف

1. ترتيب الصفوف في R

يتم ترتيب عملية الصف الأول في dpylr () . تتيح لك هذه الوظيفة إعادة ترتيب الصفوف. إنه يعمل أولاً عن طريق ترتيب إطار البيانات df ثم الحقول المحددة.

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

على سبيل المثال ، دعنا نفرز حسب معرف الفريق . قم بتشغيل الترتيب (فرق ، معرف الفريق) .

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

إذا كنت تريد ترتيبها بترتيب تنازلي ، فأنت بحاجة إلى استخدام وظيفة desc () .

على سبيل المثال ، إذا كنت تريد الفرز حسب السنة بترتيب تنازلي ، فقم بتشغيل الترتيب (فرق ، تنازلي (معرّف السنة)) .

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

عندما تفعل هذا ، فأنت لا تعيد الإخراج إلى الفرق . أنت فقط ترى النتيجة في وحدة التحكم.

من الممكن أيضًا الفرز وفقًا لمعايير متعددة. على سبيل المثال ، إذا كنت تريد الفرز حسب معرف الفريق ثم yearID بترتيب تنازلي ، فأنت تحتاج فقط إلى تشغيل هذا الكود:

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

عندما تقوم بفرز الصفوف ، فأنت لا تغير البيانات. يتم نقل البيانات للتو. لا شيء يتم إضافته أو إزالته.

2. تصفية الصفوف في R

تضيف وظيفة عامل التصفية () البيانات أو تزيلها وفقًا للمعايير المحددة. كودها الأساسي هو:

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

كمثال ، دعنا نحصل على جميع البيانات التي يكون فيها رقم تعريف العام أكبر من أو يساوي 2000. اتبع تنسيق وظيفة التصفية وأدخل المعلومات المطلوبة. ثم قم بتشغيله. لا تنسى تخصيص هذا لكائن جديد. في هذه الحالة ، تم تعيينه للحديث .

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

للتحقق مما إذا كانت الصفوف قد تمت تصفيتها بالفعل ، يمكنك استخدام الدالة dim () . يعطي عدد الصفوف والأعمدة في إطار البيانات.

إذا قمت بتشغيل (فرق) خافتة ، فسترى أن إطار البيانات يحتوي على 2955 صفًا و 48 عمودًا.

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

إذا قمت بتشغيل وظيفة خافتة في الحديث ، فسترى أنه تم تقليل عدد الصفوف إلى 630 بينما ظل عدد الأعمدة كما هو.

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

تم قطع الصفوف لأن بعض السجلات تتجاوز عام 2000.

تصفية الصفوف حسب الحقول المتعددة

من الممكن أيضًا تصفية الصفوف حسب الحقول المتعددة في R. ستحتاج إلى استخدام عبارات AND و OR .

على سبيل المثال ، دعنا نصفي الفرق حسب المنطقة. في هذه الحالة ، يتم إنشاء كائن جديد ohio . معايير التصفية هي أن معرف الفريق يجب أن يشمل كليفلاند وسينسيناتي فقط .

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

تحتاج إلى استخدام علامة المساواة المزدوجة ( == ) للتحقق من المساواة. إذا كنت تستخدم علامة يساوي واحدة فقط ، فسوف يعتبرها R عامل تعيين. استخدم علامة العطف ( & ) لتمثيل AND.

للتحقق ، استخدم وظيفة خافتة . سترى أن عدد الصفوف هو 0.

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

هذا يعني أنه لا يوجد أي فريق يقع مقر كل منهما في كليفلاند وسينسيناتي.

بعد ذلك ، لنجرب كليفلاند أو سينسيناتي. يتم تمثيل عامل التشغيل بواسطة مشغل الأنبوب ( | ). لذا ، كل ما عليك فعله هو استبدال علامة العطف بمشغل الأنابيب ثم تشغيله. بعد ذلك ، قم بتشغيل وظيفة التعتيم مرة أخرى.

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

ستلاحظ أن هناك 251 صفاً بدلاً من صفر.

الآن ماذا لو نسيت استخدام علامة المساواة المزدوجة وبدلاً من ذلك استخدمت علامة واحدة فقط؟ إليك ما يحدث:

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

سيعرض RStudio رسالة خطأ مفيدة للغاية في وحدة التحكم لتذكيرك باستخدام علامة المساواة المزدوجة.

3. تجميع حسب وتلخيص الصفوف في R

تسمح لك وظيفة التجميع حسب () بتجميع السجلات حسب الأعمدة المحددة ، ثم بناءً على هذا التجميع ، تلخيص عمود آخر.

تتبع وظيفة المجموعة () هذه الخوارزمية:

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

على سبيل المثال ، دعنا نجمع حسب معرف الفريق ونخصصه لكائن جديد. في هذه الحالة ، يسمى الكائن الجديد team_ID . ثم اطبعها.

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

في لوحة التحكم ، ستلاحظ أن السطر الأول يقول إنه tibble .

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

tibble هو تحسين مرتب على إطار البيانات الأساسي . إنها ميزة في الحزمة تعمل على زيادة وتحسين ما هو متاح خارج الصندوق.

السطر الثاني هو المجموعات . لذلك ، يتم الآن تجميع البيانات حسب عمود معرف الفريق.

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

وبهذا ، يمكنك الآن استخدام دالة التلخيص () في تلك المجموعات.

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

ملاحظة: يمكن أن تكون دالة التلخيص إما بحرف s أو z ، وستعتمد على استخدام الإنجليزية البريطانية أو الأمريكية.

على سبيل المثال ، دعنا نلخص team_ID ونحصل على بعض الإحصائيات الموجزة الأساسية. دعونا نبحث عن متوسط ​​وأدنى وأقصى عدد من المكاسب لكل فريق. تذكر أن تقوم بتمييز الكود بالكامل قبل اختيار تشغيل .

ترتيب الصفوف وتصفيتها وتجميعها في R باستخدام Dplyr

يمكنك بعد ذلك أن ترى في لوحة التحكم أنه يتم عرض ملخص لإحصائيات كل فريق. هذا مشابه جدًا للجدول المحوري حيث تقوم بتجميع البيانات وتلخيصها.


إطارات البيانات في R: تعلم مستويات العوامل الأساسية
في R: استخدام المتغيرات الفئوية والترتيبية
إضافة وإزالة وإعادة تسمية الأعمدة في R باستخدام dplyr

خاتمة

للتلخيص ، تمت مناقشة عمليتين في dplyr. ركز برنامج تعليمي سابق على عمليات العمود. في غضون ذلك ، أوضح لك هذا الدرس الحالي كيفية إجراء عمليات الصفوف باستخدام حزمة dplyr في RStudio. على وجه التحديد ، تعلمت كيفية ترتيب الصفوف وتصفيتها وتجميعها في R.

الشيء التالي الذي يجب تعلمه هو كيفية الجمع بين هاتين العمليتين. سيساعدك استخدام جميع الوظائف التي تعلمتها حتى الآن بشكل كبير في إنشاء الأكواد في R. ومع ذلك ، فإن الأسلوب الأكثر فائدة هو خط الأنابيب. سيساعد هذا كل شيء على التدفق معًا. لذا ، تأكد من مراجعة البرامج التعليمية التالية أيضًا.


ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

كيفية حفظ وتحميل ملف RDS في R.

كيفية حفظ وتحميل ملف RDS في R.

ستتعلم كيفية حفظ وتحميل الكائنات من ملف .rds في R. ستغطي هذه المدونة أيضًا كيفية استيراد الكائنات من R إلى LuckyTemplates.

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

في هذا البرنامج التعليمي للغة ترميز DAX ، تعرف على كيفية استخدام وظيفة الإنشاء وكيفية تغيير عنوان القياس ديناميكيًا.

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

سيغطي هذا البرنامج التعليمي كيفية استخدام تقنية Multi Threaded Dynamic Visuals لإنشاء رؤى من تصورات البيانات الديناميكية في تقاريرك.

مقدمة لتصفية السياق في LuckyTemplates

مقدمة لتصفية السياق في LuckyTemplates

في هذه المقالة ، سأقوم بتشغيل سياق عامل التصفية. يعد سياق عامل التصفية أحد الموضوعات الرئيسية التي يجب على أي مستخدم LuckyTemplates التعرف عليها في البداية.

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أريد أن أوضح كيف يمكن لخدمة تطبيقات LuckyTemplates عبر الإنترنت أن تساعد في إدارة التقارير والرؤى المختلفة التي تم إنشاؤها من مصادر مختلفة.

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تعرف على كيفية إجراء تغييرات في هامش الربح باستخدام تقنيات مثل قياس التفرع والجمع بين صيغ DAX في LuckyTemplates.

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

سيناقش هذا البرنامج التعليمي أفكار تجسيد مخازن البيانات وكيفية تأثيرها على أداء DAX ​​في توفير النتائج.

إعداد تقارير الأعمال باستخدام LuckyTemplates

إعداد تقارير الأعمال باستخدام LuckyTemplates

إذا كنت لا تزال تستخدم Excel حتى الآن ، فهذا هو أفضل وقت لبدء استخدام LuckyTemplates لاحتياجات إعداد تقارير الأعمال الخاصة بك.

ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته

ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته

ما هي بوابة LuckyTemplates؟ كل شيئ ترغب بمعرفته