الأسباب التي تؤدي إلى انهيار مركز البيانات

يرتكب مشغلو البيانات أحيانًا أخطاء قد تؤدي إلى إغلاق مركز البيانات بالكامل. ومع ذلك، يمكن تجنب معظم هذه المشكلات من خلال إجراءات الصيانة وإجراءات الفحص والحس السليم وخبرة مشغلي النظام.

يعد "الانقطاع غير المخطط له في مركز البيانات" طريقة مهذبة للحديث عن وجود مشكلات في مركز البيانات تؤدي إلى التوقف عن العمل. سواء كان السبب الجذري هو خطأ في الأجهزة، أو خطأ في البرنامج، أو خطأ بشري، فإن معظم هذه الأخطاء يمكن، بل ويجب، منعها مسبقًا. ومع وجود مستوى عالٍ من تكرار المخاطر في مراكز البيانات اليوم، أصبح منع الحوادث مقدمًا أمرًا ممكنًا تمامًا.

أحد الأشياء المثيرة للاهتمام هو أنه لا يزال من الممكن حدوث أخطاء كبيرة وصغيرة طوال الوقت في مركز البيانات، والضرر الناتج عن توقف مراكز البيانات عن العمل ليس صغيرًا، حتى ولو لمدة قصيرة فقط. وفقًا لدراسة أجرتها Data Center Knowledge، يمكن أن يكلف توقف مركز البيانات الشركات حوالي 7900 دولار في الدقيقة. في الواقع، 93% من الشركات التي توقفت مراكز بياناتها عن العمل لمدة 10 أيام أو أكثر أفلست في غضون عام، وانهارت 40% منها على الفور. ووجدت دراسة أخرى أجريت على 41 مركز بيانات تم تقييمها أن متوسط ​​تكلفة الانقطاعات غير المخطط لها شملت أكثر من 179 ألف دولار في انقطاع الأعمال، وحوالي 118 ألف دولار في الإيرادات المفقودة وحوالي 42 ألف دولار في الإنتاجية. إذا ركز مديرو مراكز البيانات ببساطة أكثر على البحث وإصلاح الأسباب الرئيسية للأخطاء الشائعة، فسيقللون بشكل كبير من المخاطر المحتملة.

الأسباب التي تؤدي إلى انهيار مركز البيانات

تكمن المشكلة في أن العديد من مشغلي ومشغلي مراكز البيانات يركزون غالبًا على النمو والإيرادات بدلاً من الحفاظ على ما هو موجود بالفعل وتعزيزه. إذا انتبهت للمسؤولين في العديد من مراكز البيانات العامة والخاصة اليوم، فسوف ترى أنهم مهتمون بشكل حصري تقريبًا بزيادة سعة التخزين، وزيادة كثافة الخادم، وزيادة كثافة الخادم. أنظمة التبريد، على سبيل المثال. في حين أن كل هذا عظيم ومطلوب بشدة ويظهر نموًا مذهلاً في صناعة تخزين البيانات، فإنه يوضح أيضًا سبب فشل مراكز البيانات الذي يحدث بشكل متزايد.

في هذه المقالة، سوف نستكشف الأسباب الشائعة لتعطيل مراكز البيانات، ونسلط الضوء على ما يمكن للمسؤولين فعله لتقليلها أو حتى القضاء عليها وإصلاح هذه المشكلات تمامًا، بالإضافة إلى تحسين استقرار النظام الخاص بك.

الأسباب التي تؤدي إلى انهيار مركز البيانات

خطأ سببه البشر

هذه هي أبسط الأسباب وأيضًا من أصعب الأسباب التي يجب تجنبها. ببساطة، يمكن لأي شخص أن يرتكب الأخطاء. نظرًا لأن 22% من حالات انقطاع التيار الكهربائي ناجمة عن خطأ بشري، فإن هذا السبب يستحق النظر فيه بعناية، والأهم من ذلك أنه يمكن منعه بسهولة نسبيًا.

ترخيص النظام غير لائق

الأسباب التي تؤدي إلى انهيار مركز البيانات

في الواقع، عدد قليل جدًا من المسؤولين لديهم حق الوصول الكامل وغير المقيد إلى جميع الأنظمة في مركز البيانات. بدلاً من منح هذا الإذن لعدد أكبر من الأشخاص، يجب إدارة الوصول بإحكام. خلاف ذلك، فمن الممكن تماما أن يحدث خطأ خطير في النظام. على سبيل المثال، في حادثة Joyent في عام 2014، قام مسؤول ذو خبرة بإعادة تشغيل جميع الأجهزة الافتراضية عن طريق الخطأ في مركز البيانات الشرقي للشركة ببضع نقرات فقط.

إجراءات النسخ الاحتياطي سيئة

الأسباب التي تؤدي إلى انهيار مركز البيانات

عند التخطيط لمهام الصيانة، هناك خطوة مهمة ولكن غالبًا ما تُنسى وهي عملية النسخ الاحتياطي. في كثير من الأحيان، يتم توثيق العمليات ولكن لا يتم مراجعتها بشكل شامل، وفي كثير من الأحيان لا تتم استعادة الأشياء بالكامل إلى شكلها الأصلي بعد الصيانة.

إجراء الكثير من التغييرات

الأسباب التي تؤدي إلى انهيار مركز البيانات

أثناء الصيانة، إذا حاول المسؤول إجراء العديد من التغييرات مرة واحدة، فقد يتسبب ذلك في حدوث مشكلات. أولاً، غالبًا ما يتمتع المسؤولون بعقلية متسرعة لأنه يتعين عليهم إكمال عدد كبير من المهام في فترة زمنية قصيرة، مما يؤدي غالبًا إلى ارتكاب الأخطاء. ثانيًا، نظرًا لحدوث العديد من التغييرات في نفس الإطار الزمني، فإن ذلك يجعل استكشاف الأخطاء وإصلاحها بعد التغيير مهمة أكثر صعوبة.

التراخي في إدارة الموارد البشرية

الأسباب التي تؤدي إلى انهيار مركز البيانات

قد يبدو الأمر قاسيًا بعض الشيء، لكن يحتاج الموظفون إلى معرفة كيفية اتباع القواعد في المركز بشكل صارم ويجب عليهم الانضباط الشديد عند مخالفتها. على سبيل المثال، لا يسمح أي مركز بيانات للموظفين بتناول الطعام أو الشراب أثناء العمل، أو يجب وضع علامة واضحة على مفاتيح الطوارئ وتأمينها. قد تبدو هذه الأشياء صغيرة ولكنها يمكن أن تؤدي إلى حوادث كبيرة، لذا تأكد دائمًا من اتباع القواعد بدقة.

خطأ في النظام

الطاقة الاحتياطية غير مضمونة، فالمعدات قديمة أو تم تكوينها بشكل خاطئ.

الأسباب التي تؤدي إلى انهيار مركز البيانات

السبب الأكثر شيوعًا لتعطل مركز البيانات هو انقطاع التيار الكهربائي. يمكن أن يحدث انقطاع التيار الكهربائي في أي وقت. ولذلك، تم تصميم مراكز البيانات بمصادر طاقة احتياطية في حالة انقطاع التيار الكهربائي الرئيسي. غالبًا ما تستخدم البطاريات أو أنظمة المولدات كطاقة احتياطية. المشكلة هي أنه قد لا يتم استبدال البطارية في الوقت المناسب، وقد لا يتم فحص المولد وصيانته، مما يؤدي إلى حدوث مشاكل عند انقطاع التيار الكهربائي. كل هذا يعني أن إمكانيات النسخ الاحتياطي الخاصة بك قد لا تكون متاحة عندما تكون في أمس الحاجة إليها.

في حالة انقطاع التيار الكهربائي، تستخدم أنظمة UPS البطاريات كطاقة احتياطية، مما يجعلها جزءًا أساسيًا من الحفاظ على وقت تشغيل مراكز البيانات. ومع ذلك، البطارية لا تعمل دائما بشكل جيد. قم بإجراء الصيانة الموصى بها من قبل الشركات المصنعة نفسها للتحقق من صحة البطارية. يجب فحص البطاريات على الأقل كل ثلاثة أشهر للتأكد من تركيبها وتفريغها وشحنها بشكل صحيح. يتضمن ذلك عمليات الفحص البصري وفحص السعة والمراقبة المنتظمة من خلال البرامج أو مورد UPS نفسه.

بالإضافة إلى ذلك، يمكن أن تؤدي درجات الحرارة المرتفعة إلى تقصير عمر بطارية النظام. يمكن أن يساعد إنشاء غرفة UPS مخصصة في تقليل تآكل عمر البطارية. يجب عليك أيضًا تجنب تفريغ البطارية بشكل متكرر والعناية جيدًا بالوصلات السائبة أو الموصلات البالية. باختصار، تعد UPS نظامًا مهمًا بشكل خاص، فهي تتطلب تصميمًا معقولًا واستخدامًا مناسبًا وصيانة صارمة.

عطل في نظام التبريد

الأسباب التي تؤدي إلى انهيار مركز البيانات

تستهلك الأنظمة الميكانيكية في مركز البيانات الكثير من الكهرباء، مما يعني أنها تنبعث منها كمية كبيرة من الحرارة أثناء التشغيل. يمكن أن يصبح مركز البيانات محرقة للجثث بعد دقيقة واحدة من التشغيل. ولهذا السبب فإن نظام التبريد مهم جدًا. وحتى إذا كان لديك أجهزة استشعار لدرجة الحرارة تقرأ وتنبيهات مرسلة إلى المسؤولين، فيجب عليك التأكد من أن لديك الوقت الكافي لتنفيذ إجراءات التبريد الاحتياطية للمركز قبل أن يذوب كل شيء.

بالإضافة إلى ذلك، فإن العديد من أنظمة التبريد ليست مصممة حقًا لمواكبة مستويات الحرارة المتزايدة في مركز بيانات حديث عالي السعة. مرة أخرى، يمكن أن يساعد تحديد المواقف التي يعمل فيها مركز البيانات الخاص بك بسعة 100% في التخطيط لأنظمة تبريد أفضل في المستقبل. من الضروري أيضًا إنشاء أنظمة تحذير لتقلبات درجة حرارة النظام. يمكنك استخدام بعض برامج النمذجة الحرارية وبعض أنظمة DCIM. بالإضافة إلى ذلك، تعتبر المبردات الكيميائية خيارًا أفضل من الأنظمة المعتمدة على الماء.

عملية التحويل التلقائي لا تعمل بشكل صحيح

الأسباب التي تؤدي إلى انهيار مركز البيانات

يمتلك معظم مقدمي الخدمات والمؤسسات والشركات مراكز بيانات احتياطية تستخدم لمراكز بيانات الإنتاج. في حالة انقطاع التيار الكهربائي في مركز البيانات الرئيسي، سيتم تشغيل مركز البيانات الاحتياطية تلقائيًا وسيتم توجيه كل حركة المرور إلى منشأة النسخ الاحتياطي تلك. إذا تم تنفيذها بشكل صحيح، فيجب أن تكون العملية سلسة وصولاً إلى المستخدم النهائي. لسوء الحظ، لا تعمل عمليات تجاوز الفشل التلقائي في كثير من الأحيان كما هو متوقع. السبب المعتاد لهذه المشكلة هو عدم وجود اختبارات منتظمة. حتى التغييرات الصغيرة في البنية التحتية للإنتاج يمكن أن يكون لها تأثير كبير على تجاوز الفشل التلقائي. لذلك، عند إجراء أي تغييرات على البنية التحتية، يجب اختبار إجراءات تجاوز الفشل التلقائي للتأكد من عدم انحراف أي شيء عن العملية.

الأجهزة التي عفا عليها الزمن

الأسباب التي تؤدي إلى انهيار مركز البيانات

جميع أجهزة كل نظام لها عمر معين. وكلما طالت فترة استخدامك لأحد الأجهزة، زادت احتمالية مواجهة المشكلات. يعلم الجميع ذلك، ولكن من الشائع أن يتعطل تطبيق مهم لمجرد أنه يعمل على أجهزة عمرها 10 سنوات. غالبًا ما تنشأ هذه المشكلات بسبب عدم وجود خطط شاملة للاستبدال والترقية لمنصات الأجهزة أو البرامج الجديدة، أو بسبب نقص الميزانية. إذا كان الأمر يتعلق بالمال، فلا يوجد شيء يمكنك فعله. ولكن إذا حاولت ببساطة الاستفادة لأطول فترة ممكنة، فيمكن أن تحدث مشكلة في أي وقت، وعندما تحدث، يمكن أن يكون الضرر الناجم عن المشكلة أكبر بكثير.

يعاني نظام إخماد الحرائق من مشكلة تسرب المياه

الأسباب التي تؤدي إلى انهيار مركز البيانات

تستخدم معظم مراكز البيانات الحديثة أنظمة الحماية من الحرائق بدون ماء حتى لا تلحق الضرر بالمعدات إذا تم تفعيلها عن قصد أو عن طريق الخطأ. لكن العديد من المرافق القديمة لا تزال تستخدم أنظمة الحماية من الحرائق التقليدية في مراكز البيانات الخاصة بها. تسببت العديد من تسربات المياه في انقطاعات كبيرة.

يتم تنشيط إيقاف تشغيل الطاقة في حالات الطوارئ عن طريق الخطأ

الأسباب التي تؤدي إلى انهيار مركز البيانات

إن المستوى العالي من الأمن المادي المطبق في معظم مراكز البيانات لا يردع اللصوص ببساطة. كما أنها موجودة لتجنب الموظفين الذين لا يفهمون كيفية عمل مركز البيانات. على سبيل المثال، يدخل مسؤول التطبيق إلى مركز البيانات ويقوم عن طريق الخطأ بإيقاف تشغيل الطاقة في حالات الطوارئ (EPO). EPO هو زر أحمر كبير مسؤول عن قطع الطاقة عن النظام بأكمله. ومن الواضح، بالنسبة لأولئك الذين لا يفهمون أو ليس لديهم الخبرة، فإن مثل هذا الارتباك ممكن تمامًا.

تحت الهجوم السيبراني، DDOS

الأسباب التي تؤدي إلى انهيار مركز البيانات

على مر السنين، أصبحت الهجمات السيبرانية أحد الأسباب الرئيسية لفشل مراكز البيانات، من 2% فقط في عام 2010 إلى 22% في عام 2016. ويجب على مشغلي مراكز البيانات اتخاذ الإجراءات اللازمة لإنشاء أنظمة للكشف عن مخاطر الهجمات والتخفيف من حدتها مبكرًا.

يصعب الدفاع عن مراكز البيانات ضد هجوم DDoS واسع النطاق . يوفر معظم مزودي خدمات الإنترنت بعض الحماية في الطبقتين 3 و4 من الشبكة، لكن خدماتك تحتاج إلى حماية إضافية في الطبقة 7، والتي يمكن استهدافها بشكل خاص عبر HTTP GET أو مكالمات مماثلة. يمكن دمج خدمات التخفيف مثل جدران الحماية وIPS/IDS وDDoS لإعادة توجيه حركة المرور.

كارثة طبيعية

يمكن أن تؤدي الزيادة الأخيرة في العواصف والفيضانات إلى تعطيل كبير لمراكز البيانات. وقعت أكثر من 250 كارثة طبيعية في عام 2010 في الولايات المتحدة. وفقًا للإحصاءات، تكبدت ولاية نيوجيرسي بالولايات المتحدة الأمريكية خسائر بقيمة 63.9 مليار دولار بسبب انقطاع الأعمال بسبب العاصفة ساندي في عام 2012.

خطوات للحد من الأضرار الناجمة عن حوادث "انهيار" مركز البيانات

إذا تم التخطيط بعناية لوقت التوقف عن العمل للصيانة الروتينية وتم تحذير العملاء مسبقًا بشأن توقف المركز، خاصة خلال فترة انخفاض حركة المرور، فسيكون العملاء أكثر تعاطفًا وستنخفض الأضرار بشكل كبير. ويحدث الضرر الأكبر عندما يحدث بشكل غير متوقع، وخاصة عندما يستمر لفترة طويلة، وتنشأ مشاكل إضافية. حافظ على استقرار نظام موارد الشركة بأكمله حتى يتمكن الموظفون من أداء وظائفهم بفعالية، مما يقلل العبء على أقسام تكنولوجيا المعلومات.

خاصة:

  • قم بعمل نسخة احتياطية من بياناتك: في حالة مواجهة انقطاع في مركز البيانات، يجب أن تكون بياناتك (والأهم من ذلك، بيانات عملائك) جاهزة عند البدء. ابدأ في استكشاف الأخطاء وإصلاحها وتشغيلها مرة أخرى. يؤدي إجراء نسخ احتياطية منتظمة إلى الحد من مخاطر الانهيار الحقيقي. إذا كانت شركتك قادرة على تحمل تكاليف ذلك، يمكن لبعض المنتجات مثل خط إنتاج VPLEX من EMC أو برنامج النسخ الاحتياطي والنسخ الاحتياطي من VEEAM أن تساعد في تقليل وقت التوقف عن العمل عن طريق التبديل تلقائيًا إلى موقع النسخ الاحتياطي.
  • حافظ على المراقبة المنتظمة لنظام الخادم: المراقبة هي خدمة يمكنك إجراؤها بانتظام وعادةً لا تكلف الكثير. تُعلمك خدمة المراقبة التابعة لجهة خارجية باحتمال توقف الخادم عن العمل حتى تتمكن من معالجة المشكلة على الفور.
  • تقليل الأخطاء البشرية: توخي الحذر عند العمل أو التجول حول أنظمة الخادم أو الأسلاك الكهربائية لتجنب إتلافها عن طريق الخطأ، أو ببساطة لا تلمس المفاتيح الغامضة دون خبرتك. إبقاء السوائل بعيدا عن الأنظمة الميكانيكية. اتصل بأخصائي حماية البيانات في أي وقت يحتاج فيه الخادم إلى الترقية أو الصيانة، والتزم بقواعد المركز.

يجب على كل مركز بيانات، بدءًا من المراكز الصغيرة وحتى المرافق على مستوى المؤسسات ومقدمي الخدمات، أن يسعى جاهداً بنسبة 100% لتوفير خدمات موثوقة للمستخدمين. من خلال تخصيص الوقت للتخطيط للمستقبل، واتباع مبادئ الصيانة والعوامل البشرية، يمكن لمركز البيانات الخاص بك تجنب بعض الأسباب الأكثر شيوعًا للفشل، مثل مشكلة انقطاع الخدمة.

شاهد المزيد

اترك تعليقاً

كيفية إزالة إشعار طلب حقوق الطبع والنشر في الزاوية اليمنى من الشاشة على نظام التشغيل Windows 10

كيفية إزالة إشعار طلب حقوق الطبع والنشر في الزاوية اليمنى من الشاشة على نظام التشغيل Windows 10

هل ترى إشعار تفعيل Windows 10 في الزاوية اليمنى من الشاشة؟ سترشدك هذه المقالة إلى كيفية حذف إشعار طلب حقوق الطبع والنشر على نظام التشغيل Windows 10.

تعليمات من AZ حول كيفية تثبيت Windows 10 الإصدار 14393.222

تعليمات من AZ حول كيفية تثبيت Windows 10 الإصدار 14393.222

أصدرت Microsoft مؤخرًا آخر تحديث تراكمي لمستخدمي أجهزة الكمبيوتر التي تعمل بنظام Windows 10 والذي يسمى Build 14393.222. يعمل هذا التحديث الذي تم إصداره لنظام التشغيل Windows 10 بشكل أساسي على إصلاح الأخطاء بناءً على تعليقات المستخدمين وتحسين تجربة أداء نظام التشغيل.

قم بحماية شبكة الكمبيوتر الخاص بك مع Bastion host في 3 خطوات فقط

قم بحماية شبكة الكمبيوتر الخاص بك مع Bastion host في 3 خطوات فقط

هل لديك أجهزة كمبيوتر على شبكتك المحلية تحتاج إلى وصول خارجي؟ يمكن أن يكون استخدام مضيف أساسي كحارس بوابة لشبكتك حلاً جيدًا.

3 طرق لمسح كافة سجلات الأحداث بسرعة في نظام التشغيل Windows 10

3 طرق لمسح كافة سجلات الأحداث بسرعة في نظام التشغيل Windows 10

في بعض الأحيان قد تحتاج إلى حذف سجلات الأحداث القديمة مرة واحدة. في هذا الدليل، سيعرض لك موقع Quantrimang.com 3 طرق لحذف كافة سجلات الأحداث بسرعة في Windows 10 Event Viewer.

كيفية إنشاء مفتاح Windows إذا كانت لوحة المفاتيح غير متوفرة

كيفية إنشاء مفتاح Windows إذا كانت لوحة المفاتيح غير متوفرة

إذا كنت تفضل استخدام لوحة مفاتيح كلاسيكية قديمة، مثل IBM Model M، والتي لا تتضمن مفتاح Windows فعليًا، فهناك طريقة سهلة لإضافة المزيد، عن طريق استعارة مفتاح لا تستخدمه كثيرًا.

كيفية إنشاء وضع خلفية شفافة على نظام التشغيل Windows 10

كيفية إنشاء وضع خلفية شفافة على نظام التشغيل Windows 10

WindowTop هي أداة لديها القدرة على تعتيم جميع نوافذ التطبيقات والبرامج التي تعمل على أجهزة الكمبيوتر التي تعمل بنظام Windows 10. أو يمكنك استخدام واجهة ذات خلفية داكنة على النوافذ.

تساعدك أساليب IP المزيفة على الوصول بشكل مجهول

تساعدك أساليب IP المزيفة على الوصول بشكل مجهول

لقد ذكرنا في العديد من المقالات السابقة أن البقاء مجهول الهوية عبر الإنترنت أمر في غاية الأهمية. يتم تسريب المعلومات الخاصة كل عام، مما يجعل الأمان عبر الإنترنت ضروريًا بشكل متزايد. وهذا أيضًا هو السبب وراء ضرورة استخدام عناوين IP الافتراضية. فيما يلي، سنتعرف على طرق إنشاء عناوين IP وهمية!

كيفية إيقاف تشغيل شريط اللغة على شريط مهام Windows 8

كيفية إيقاف تشغيل شريط اللغة على شريط مهام Windows 8

شريط اللغة في نظام التشغيل Windows 8 عبارة عن شريط أدوات لغة مصغر مصمم للعرض تلقائيًا على شاشة سطح المكتب. ومع ذلك، يرغب العديد من الأشخاص في إخفاء شريط اللغة هذا على شريط المهام.

نصائح لتحسين سرعة الاتصال بالإنترنت من Linksys

نصائح لتحسين سرعة الاتصال بالإنترنت من Linksys

يعد تعظيم سرعة الإنترنت أمرًا ضروريًا لتحسين اتصال الشبكة لديك. يمكنك الحصول على تجربة ترفيه وعمل مثالية باستخدام أجهزة الكمبيوتر وأجهزة التلفزيون المجهزة للإنترنت ووحدات التحكم في الألعاب وما إلى ذلك.

كيفية إعداد WEP، WPA، WPA2 لجهاز التوجيه Linksys

كيفية إعداد WEP، WPA، WPA2 لجهاز التوجيه Linksys

يعد الاتصال اللاسلكي أمرًا ضروريًا اليوم، ولهذا السبب، يعد الأمان اللاسلكي ضروريًا لضمان السلامة في شبكتك الداخلية.