البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

اليوم ، أريد أن أتحدث عن مفهوم نمذجة البيانات يسمى البعد غير الهام . من اسمها ، قد تعتقد أنها تقنية مهينة وشيء تريد تجنبه ، لكنها في الواقع طريقة مفيدة.

في الواقع ، عملت على سؤال من ، وكان البعد غير الهام هو الحل الأمثل لذلك. بمجرد رؤيته وفهمه ، ستجد الكثير من التطبيقات له في عملك الخاص. يمكنك مشاهدة الفيديو الكامل لهذا البرنامج التعليمي أسفل هذه المدونة.

جدول المحتويات

ما هي أبعاد الخردة؟

تُعرِّف مجموعة أدوات مستودع البيانات من Kimball و Ross ، وهي أحد الأناجيل الخاصة بالنمذجة الأبعاد ، على أنها مجموعة من العلامات والمؤشرات ذات العلاقة الأساسية المنخفضة عادةً . تعني العلاقة الأساسية المنخفضة عددًا صغيرًا من الملاحظات الفريدة داخل مجال معين.

في مثالنا ، لدينا نموذج بيانات لأعمالنا في بناء أجهزة كمبيوتر مخصصة. نموذج البيانات يتعلق بالأوامر والفواتير. لدينا أيضًا عدد من الأعلام حيث يمكننا التقاط نوع المعالج ونوع تكوين البرج (مضغوط أو كامل) والغرض (الألعاب أو محطة العمل).

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

تحديد أبعاد الخردة باستخدام تشبيه درج المطبخ غير المهم

إذا نظرت إلى كل حقل من هذه الحقول ، ستجد ملاحظتين فريدتين فقط في كل مجال. هذا ما سيشير إليه Kimball على أنه علم أساسي منخفض . يقول إنه من خلال إنشاء بُعد مجرد ، نزيل العلامات من جدول الحقائق بينما نضعها في إطار أبعاد مفيد.

يعتبر تشبيه درج المطبخ غير المرغوب فيه لأبعاد القمامة أمرًا جيدًا. كل شخص لديه درج مليء بالأربطة المطاطية ، والدبابيس ، والبطاريات ، وشموع أعياد الميلاد ، وما إلى ذلك. ليس من المهم لأي من هذه الأشياء أن تضمن وجود درج خاص بها ، ولكن يجب أن يكون لديك مكان لوضعها.

يمكن أن يؤدي الاحتفاظ بها إلى تضخم حجم جدول الحقائق. لنفترض أن لدينا جدول حقائق يحتوي على مليون سجل. لقد بنينا الكثير من أجهزة الكمبيوتر ، ولكل جهاز كمبيوتر نبنيه ، علينا تحديد المعالج والبرج والغرض. هذا يعني أنه بالنسبة لمليون صف من أجهزة الكمبيوتر التي تم طلبها ، لدينا أيضًا 3 ملايين علامة في جدول الحقائق.

تصغير حجم جدول الحقائق

يمكننا نقلها إلى جدول أبعاد والربط فقط بمعرف النموذج لإزالة 3 ملايين إشارة من جدول الحقائق. للقيام بذلك ، يمكننا عمل جدول منفصل لكل من هذه العلامات وسيعمل. ولكن ستؤدي هذه العملية إلى تعقيد نموذج البيانات ، حيث تريد عادةً تجنب جداول العمود الواحد.

الحل المثالي هو استخدام بُعد غير هام ، حيث يكون لديك مجموعة من العلامات الأساسية المنخفضة المرتبطة بشكل عام. هذه كلها مرتبطة بسمات أجهزة الكمبيوتر التي نبنيها ، ولكن ليس بطريقة مباشرة حقًا قد تكون لديك عادةً لجدول أبعاد معين.

مراجعة مشكلة عضو المنتدى

دعنا نلقي نظرة على التطبيق المحدد الذي تم نشره في المنتدى. أراد العضو إنشاء حقلين مختلفين ، أحدهما لـ Stalled والآخر لـ Active . إذا أجرى العميل معاملة في آخر 45 يومًا ، فسيتم تمييزها على أنها نشطة ؛ خلاف ذلك ، يتم وضع علامة عليه على أنه متوقف.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

أراد العضو أيضًا جدول أبعاد آخر لنوع العميل ، والذي يكون إما طلبًا متعددًا أو طلبًا واحدًا. إذا كان الحساب يحتوي على معاملتين أو أكثر في أي وقت عبر التاريخ باستخدام رقم حساب واحد ، فسيتم اعتبار ذلك عميلًا متعدد الطلبات. وإذا كان لديهم طلب واحد فقط لرقم حساب معين ، فسيكون ذلك عميل طلب واحد.

فهذان هما العلمان اللذان نريد تطويرهما. دعنا ننتقل إلى LuckyTemplates ونكتشف كيفية القيام بذلك.

نمذجة البيانات لبعد البريد العشوائي

دعنا نلقي نظرة على نموذج البيانات. إنه نموذج بيانات بسيط حقًا. لدينا جدول التواريخ الممتد وجدول المعاملات .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

يحتوي جدول حركاتنا على ثلاثة حقول فقط: رقم الحساب وتاريخ الفاتورة وكمية المبيعات .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

بشكل عام ، إذا تمكنا من دفع التحول أقرب إلى المصدر ، فسنقوم بذلك. هذا ليس ديناميكيًا في سياق جلسة إعداد التقارير ، لذلك لا نحتاج إلى القيام بذلك في DAX .

يجب أن نقوم بذلك إما في استعلام الطاقة ، أو مستودع البيانات / SQL إذا كان لدينا هذا الخيار. لكن في الوقت الحالي ، لنفترض أننا لا نفعل ذلك وأننا نقوم بذلك فقط في استعلام القوة .

تحديد نوع العميل لبعد البريد العشوائي

أول شيء سنفعله هو معرفة نوع العميل ، سواء كان أمرًا واحدًا أو معاملة متعددة الطلبات. سنستخدم صفوف Group By و Count و Count .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

ثم أضف جميع البيانات واجعل ذلك عملية كل الصفوف بحيث لا نرجع الجدول المجمع ، ولكن الجدول الأولي مع عدد الصفوف في كل صف.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

دعنا نلقي نظرة على النتيجة ونوسعها.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

يمكننا إضافة عمود مخصص وتسميته نوع العميل ثم إنشاء جملة IF. العبارة هي إذا كان Count يساوي 1 ، فهو أمر واحد ؛ وإلا ، فهو متعدد الطلبات.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

سنقوم فقط بتغيير العمود إلى نوع النص. الآن ، لدينا أحد البعدين المحددين في جدول الحقائق.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

دعنا ننجز جدول الأبعاد الثاني. بالنسبة لهذا الطلب ، إذا كان آخر طلب هو 45 يومًا أو أقل من تاريخ اليوم ، فسيتم اعتبار العميل نشطًا. إذا لم يكن هناك طلب خلال 45 يومًا من اليوم ، فسيكون العميل غير نشط.

سنقوم بإضافة عمود مخصص وتسمية العمود اليوم . ثم أضف DateTime.LocalNow لتعطينا التاريخ والوقت الحاليين ، ثم Date.From لإعطائنا جزء التاريخ فقط.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

دعنا نغير هذا إلى نوع بيانات التاريخ ، ثم ننقل العمود إلى المقدمة.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

هناك طريقة بسيطة لإنشاء عملية طرح بين عمود التاريخين. ما عليك سوى تحديد هذين التاريخين ، والنقر فوق التواريخ على الشريط ، ثم النقر فوق طرح الأيام .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

سيعطيك هذا الفرق بين هذين التاريخين من حيث عدد الأيام. دعنا نسمي هذا العمود الجديد الأيام السابقة لليوم.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

الخطوة التالية هي العثور على الحد الأدنى من الأيام قبل اليوم ، مما يعني أحدث طلب لكل رقم حساب. إذا كان هذا الرقم أقل من أو يساوي 45 ، فسيكون نشطًا.

لنقم بإجراء تجميع آخر حسب ، ثم متقدم ، ثم رقم الحساب .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

مرة أخرى ، سنستخدم كل البيانات لاسم العمود الجديد وكل الصفوف للعملية.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

هذه المرة ، سنضيف الحد الأدنى من الأيام بين مع الحد الأدنى للعملية والأيام السابقة لليوم كعمود لها. سيعطينا هذا أحدث طلب.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

ثم نقوم بتوسيع كافة البيانات وإزالة رقم الحساب .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

بمجرد توسيع هذا ، سيكون لدينا الحد الأدنى من الأيام بين أرقام الحسابات.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

أخيرًا ، سنضيف عمودًا مخصصًا آخر ، ونطلق عليه اسم " توقيت العميل" . سنضع معلمة what-if إذا كان الحد الأدنى للأيام بين أقل من أو يساوي 45 ، فإنه يكون نشطًا أو متوقفًا .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

إزالة الأعمدة غير الضرورية

نظرًا لأن لدينا الآن الكثير من الأعمدة الداعمة ، فلنضغط على اختيار الأعمدة وإخراج الأعمدة التي لا نحتاج إليها.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

سنزيل الأعمدة العدد واليوم والأيام السابقة لليوم وأدنى أيام بين الأعمدة . لدينا الآن جدول الحقائق الأصلي فقط ، بالإضافة إلى عمودي نوع العميل وتوقيت العميل .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

بدلاً من الاحتفاظ بها في جدول الحقائق ، دعنا نكرر هذا الجدول.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

سوف نسمي الجدول المكرر إشارات الحساب .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

دعنا نعود إلى جدول المعاملات ونخرج حقلي نوع العميل وتوقيت العميل .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

لدينا الآن جدول الحقائق الأصلي وجدول إشارات الحساب.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

بالنسبة لجدول إشارات الحساب ، لا نحتاج إلى حقلي نوع العميل وتوقيت العميل حتى نخرجهما. نقوم فقط بتمييز كل هذه الحقول وإزالة الصفوف وإزالة التكرارات.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

لدينا الآن جدول أبعاد غير المرغوب فيه. كل ما تبقى هو النقر على إغلاق وتطبيق . الخطوة التالية هي توصيل رقم الحساب من جدول إشارات الحساب الخاص بنا برقم الحساب في جدول المعاملات .

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

لدينا علاقة رأس بأطراف بين جدول المعاملات (وهو جدول الحقائق) وجدول إشارات الحساب (وهو جدول أبعاد البريد غير الهام).


بناء علاقات نموذج البيانات في LuckyTemplates
Data Modeling في LuckyTemplates: النصائح وأفضل الممارسات

خاتمة

دعنا نسقط أبعاد توقيت العميل ونوع العميل في لوحة الرسم الخاصة بنا ونحولها إلى شرائح. يمكننا الآن أن نفعل بالضبط ما أراد العضو فعله في البداية ، وهو التقسيم بناءً على هذه السمات.

إذا نقرنا على Multi-Order ، فسيتركنا فقط مع أولئك الذين لديهم طلبات متعددة وإذا ذهبنا إلى الأمر الفردي ، فسيتركنا مع أولئك الذين لديهم عملية شراء واحدة.

البعد غير المهم: ما هو ولماذا هو أي شيء عدا الخردة

باختصار ، هذا هو أساسًا بُعد البريد غير الهام وكيف يمكنك إنشاؤه. يعد هذا أسلوبًا مفيدًا للغاية إذا كان لديك مجموعة متنوعة من العلامات ذات العلاقة الأساسية المنخفضة التي تريد تضمينها في نموذج البيانات الخاص بك بطريقة فعالة.

تعتبر تقنية التجميع حسب كل الصفوف مفيدة للغاية لإنشاء أبعاد البريد غير الهام هذه. أتمنى أن تكون قد وجدت هذا مفيدًا وكالعادة.

Leave a Comment

تقنية تصور LuckyTemplates: تعرف على كيفية إنشاء لوحات تصميم الخلفية

تقنية تصور LuckyTemplates: تعرف على كيفية إنشاء لوحات تصميم الخلفية

تعرف على تقنية تصور LuckyTemplates هذه حتى تتمكن من إنشاء قوالب الخلفية واستيرادها إلى تقارير LuckyTemplates الخاصة بك.

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

ما هي الذات في بايثون: أمثلة من العالم الحقيقي

كيفية حفظ وتحميل ملف RDS في R.

كيفية حفظ وتحميل ملف RDS في R.

ستتعلم كيفية حفظ وتحميل الكائنات من ملف .rds في R. ستغطي هذه المدونة أيضًا كيفية استيراد الكائنات من R إلى LuckyTemplates.

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

تمت إعادة النظر في أول N أيام عمل - حل لغة ترميز DAX

في هذا البرنامج التعليمي للغة ترميز DAX ، تعرف على كيفية استخدام وظيفة الإنشاء وكيفية تغيير عنوان القياس ديناميكيًا.

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

اعرض الرؤى باستخدام تقنية المرئيات الديناميكية المتعددة الخيوط في LuckyTemplates

سيغطي هذا البرنامج التعليمي كيفية استخدام تقنية Multi Threaded Dynamic Visuals لإنشاء رؤى من تصورات البيانات الديناميكية في تقاريرك.

مقدمة لتصفية السياق في LuckyTemplates

مقدمة لتصفية السياق في LuckyTemplates

في هذه المقالة ، سأقوم بتشغيل سياق عامل التصفية. يعد سياق عامل التصفية أحد الموضوعات الرئيسية التي يجب على أي مستخدم LuckyTemplates التعرف عليها في البداية.

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أفضل النصائح في استخدام التطبيقات في خدمة LuckyTemplates عبر الإنترنت

أريد أن أوضح كيف يمكن لخدمة تطبيقات LuckyTemplates عبر الإنترنت أن تساعد في إدارة التقارير والرؤى المختلفة التي تم إنشاؤها من مصادر مختلفة.

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تحليل تغييرات هامش الربح بمرور الوقت - التحليلات باستخدام LuckyTemplates و DAX

تعرف على كيفية إجراء تغييرات في هامش الربح باستخدام تقنيات مثل قياس التفرع والجمع بين صيغ DAX في LuckyTemplates.

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

أفكار التجسيد لذاكرة التخزين المؤقت للبيانات في DAX Studio

سيناقش هذا البرنامج التعليمي أفكار تجسيد مخازن البيانات وكيفية تأثيرها على أداء DAX ​​في توفير النتائج.

إعداد تقارير الأعمال باستخدام LuckyTemplates

إعداد تقارير الأعمال باستخدام LuckyTemplates

إذا كنت لا تزال تستخدم Excel حتى الآن ، فهذا هو أفضل وقت لبدء استخدام LuckyTemplates لاحتياجات إعداد تقارير الأعمال الخاصة بك.