بيانات السلاسل الزمنية في الباندا

في هذا البرنامج التعليمي ، ستتعلم كيفية إعادة تشكيل بيانات السلاسل الزمنية باستخدام Pandas. يمكنك مشاهدة الفيديو الكامل لهذا البرنامج التعليمي أسفل هذه المدونة .

ما هي فكرة إعادة التشكيل؟ هذا مرتبط ببيانات السلاسل الزمنية وما سنفعله هو تغيير معدل تكرار الإبلاغ عن تلك البيانات. على سبيل المثال ، تغيير القيمة السنوية إلى شهرية أو أسبوعية ، أو تغيير بيانات كل ساعة إلى بيانات يومية. باختصار ، نحن بصدد تغيير المستوى في التسلسل الهرمي.

يمكن استخدام هذا لعدد من الأسباب مثل الحصول على اتجاهات أكثر موثوقية ، وأحجام العينات ، والموسمية . في بعض التقارير ، سيكون من المنطقي أكثر إذا استخدمنا مستوى معينًا من التسلسل الهرمي مقابل مستوى آخر.

بالإضافة إلى ذلك ، يمكن أن تساعد إعادة التشكيل إذا كان لديك مصادر بيانات مختلفة وتحتاج إلى القيام بضم بيانات السلاسل الزمنية. سيساعد هذا أيضًا عند التعامل مع عدم تطابق في التسلسل الهرمي .

بيانات السلاسل الزمنية في الباندا

لتقسيم هذا بشكل أكبر ، لدينا الاختزال والاختزال.

الاختزال هو تقليل وتيرة التقارير . يمكن أن تكون أشياء مثل التحويل من ثانية إلى ساعة من أجل الحصول على قيم أقل أو تصغير الحجم من شهر إلى ربع.

من ناحية أخرى ، فإن الاختزال هو زيادة وتيرة التقارير من مستوى الشهر وصولاً إلى اليوم . سيكون لدينا المزيد من الأمثلة على هذا لاحقًا.

بيانات السلاسل الزمنية في الباندا

جدول المحتويات

كيفية إعادة تشكيل بيانات السلاسل الزمنية باستخدام الباندا

كيف سنفعل هذا في الباندا؟

بادئ ذي بدء ، سنقوم بتغيير الفهرس إلى عمود بيانات السلاسل الزمنية . بعد ذلك ، يمكننا زيادة حجم العينة باستخدام الاستيفاء ، والذي سيملأ القيم ، ويمكننا تقليص العينة للتجميع عن طريق تجميع القيم.

بيانات السلاسل الزمنية في الباندا

دعنا ننتقل إلى Jupyter Notebook Python ونتحقق من ذلك مع Pandas.

بادئ ذي بدء ، سنستخدم Pandas عن طريق كتابة استيراد الباندا كـ pd ، متبوعًا باستيراد seaborn كـ sns لتصوره ، واستيراد matplotlib.pyplot كـ plt لتخصيص تصور Seaborn .

الشيء التالي الذي يجب فعله هو الحصول على البيانات من بيانات استيراد مجموعات البيانات vega_datasets . إنه مكان جميل للحصول على مصادر عينات. أيضًا ، سنحصل على مكتبة sp = data.sp500 () و sp.head () .

بيانات السلاسل الزمنية في الباندا

ها هي بياناتنا حتى الآن. لدينا العوائد اليومية والسعر لكل يوم.

بيانات السلاسل الزمنية في الباندا

لتعيين عمود الفهرس حتى تاريخه ، اكتب sp.set_index (['date']، inplace = True) ثم اتصل بـ sp.head مرة أخرى.

بيانات السلاسل الزمنية في الباندا

استخدام Upsampling للحصول على قيم

ثم ، للحصول على المزيد من القيم ، دعنا نستخدم الاختزال. نظرًا لأن لدينا بيانات كل يوم ، يمكننا النزول إلى الساعة باستخدام أبسط دالة وهي sp [['price']]. resample ("H"). ffill () ، ثم قم بتشغيله. H تعني الساعة ، M للشهر ، D لليوم ، وهكذا. يمكنك معرفة المزيد عن هذا في وثائق Pandas .

كما نرى ، في الأول من يناير عند منتصف الليل ، يكون السعر 1394.46 ، مثل الساعات التالية من 1:00 صباحًا إلى 4:00 صباحًا. مثال آخر هو الثاني من يناير ، حيث يكون سعر الإغلاق 1366.42.

بيانات السلاسل الزمنية في الباندا

هناك طرق أخرى للقيام بذلك حتى لو لم تكن القيمة متاحة على مستوى الساعة. أيضًا ، هناك طرق أكثر تعقيدًا من مجرد إجراء تعبئة أمامية . على سبيل المثال لدينا ، ما فعلناه هو الطريقة الأساسية للقيام باختزال الاستيفاء.

بعد ذلك ، دعنا نذهب إلى الاختزال عن طريق كتابة avg_month = sp [['price]]. resample (' M '). mean () ، ثم avg_month.head () وتشغيله للتحقق.

كما هو موضح ، يمكننا رؤية اليوم الأخير من كل شهر ومتوسط ​​السعر. يمكننا تقليل العينات للحصول على قيم أقل ، أو ما نسميه تصغير الحجم.

بيانات السلاسل الزمنية في الباندا

لتصور هذا ، دعنا نكتب إعادة رسم الأبعاد المرسومة. ثم ، تليها sns.lineplot . يعمل مخطط الخط بشكل أفضل مع محور X أطول ، بينما قيمة Y هي متوسط ​​السعر الشهري.

لنرى متوسط ​​السعر للشهر ، دعنا ندير هذا.

بيانات السلاسل الزمنية في الباندا

مرة أخرى ، هناك العديد من الطرق المختلفة التي يمكننا من خلالها القيام بذلك. على سبيل المثال ، إذا أردنا معرفة أقل سعر ربع سنوي ، فكل ما علينا فعله هو كتابة ربع_لاو ، ثم ربع_لو.هيد لتشغيله.

هناك ، يمكننا الآن رؤية أقل قيمة ربع سنوية تم العثور عليها في كل ربع سنة. هذه هي الطريقة التي تقوم بها بإعادة العينة.

بيانات السلاسل الزمنية في الباندا


معالجة البيانات المفقودة في Python باستخدام أسلوب الاستيفاء
MultiIndex في Pandas لمجموعات البيانات متعددة المستويات أو الهرمية
في الباندا مع ProfileReport | بايثون في LuckyTemplates

خاتمة

لإنهاء ذلك ، تم تصميم Pandas حقًا لإعادة أخذ عينات وبيانات السلاسل الزمنية . إذا كنت تعمل على بيانات السلاسل الزمنية ولديك مستويات مختلفة من الدقة ، فقد تكون إعادة التشكيل مفيدة للغاية.

بالإضافة إلى ذلك ، تأكد من قراءة وثائق Pandas حول طريقة إعادة العينة لتتعلم الكثير من الطرق المختلفة للقيام بذلك. لقد نظرنا إلى العناصر الأساسية ، ولكن يمكنك القيام بأشياء مثل كل أسبوعين ، وآخر يوم عمل في الشهر ، والمزيد من الخيارات لإعادة التشكيل.

أتمنى لك كل خير،

جورج ماونت

Leave a Comment

تقنية تصور LuckyTemplates: تعرف على كيفية إنشاء لوحات تصميم الخلفية

تقنية تصور LuckyTemplates: تعرف على كيفية إنشاء لوحات تصميم الخلفية

تعرف على تقنية تصور LuckyTemplates هذه حتى تتمكن من إنشاء قوالب الخلفية واستيرادها إلى تقارير LuckyTemplates الخاصة بك.

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

كيفية حفظ وتحميل ملف RDS في R.

كيفية حفظ وتحميل ملف RDS في R.

ستتعلم كيفية حفظ وتحميل الكائنات من ملف .rds في R. ستغطي هذه المدونة أيضًا كيفية استيراد الكائنات من R إلى LuckyTemplates.

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

في هذا البرنامج التعليمي للغة ترميز DAX ، تعرف على كيفية استخدام وظيفة الإنشاء وكيفية تغيير عنوان القياس ديناميكيًا.

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

سيغطي هذا البرنامج التعليمي كيفية استخدام تقنية Multi Threaded Dynamic Visuals لإنشاء رؤى من تصورات البيانات الديناميكية في تقاريرك.

مقدمة لتصفية السياق في LuckyTemplates

مقدمة لتصفية السياق في LuckyTemplates

في هذه المقالة ، سأقوم بتشغيل سياق عامل التصفية. يعد سياق عامل التصفية أحد الموضوعات الرئيسية التي يجب على أي مستخدم LuckyTemplates التعرف عليها في البداية.

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أريد أن أوضح كيف يمكن لخدمة تطبيقات LuckyTemplates عبر الإنترنت أن تساعد في إدارة التقارير والرؤى المختلفة التي تم إنشاؤها من مصادر مختلفة.

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تعرف على كيفية إجراء تغييرات في هامش الربح باستخدام تقنيات مثل قياس التفرع والجمع بين صيغ DAX في LuckyTemplates.

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

سيناقش هذا البرنامج التعليمي أفكار تجسيد مخازن البيانات وكيفية تأثيرها على أداء DAX ​​في توفير النتائج.

إعداد تقارير الأعمال باستخدام LuckyTemplates

إعداد تقارير الأعمال باستخدام LuckyTemplates

إذا كنت لا تزال تستخدم Excel حتى الآن ، فهذا هو أفضل وقت لبدء استخدام LuckyTemplates لاحتياجات إعداد تقارير الأعمال الخاصة بك.