Redenen die tot het ineenstorten van het datacenter hebben geleid

Data-operators maken soms fouten die ertoe kunnen leiden dat het hele datacenter wordt afgesloten. De meeste van deze problemen kunnen echter worden vermeden door onderhoudsmaatregelen, inspectieprocedures en door het gezond verstand en de ervaring van de systeembeheerders.

Een ‘ongeplande datacenterstoring’ is een beleefde manier om te praten over een datacenter met problemen die tot downtime leiden. Of de hoofdoorzaak nu een hardwarefout, een softwarefout of een menselijke fout is, de meeste van deze fouten kunnen en moeten vooraf worden voorkomen. Met het hoge niveau van risicoredundantie in de hedendaagse datacenters is het vooraf voorkomen van incidenten heel goed mogelijk.

Een interessant gegeven is dat er nog steeds voortdurend grote en kleine fouten kunnen optreden in een datacenter, en dat de schade die wordt veroorzaakt wanneer datacenters niet meer functioneren niet klein is, zelfs niet voor slechts een korte tijd. Volgens een onderzoek van Data Center Knowledge kan downtime van datacenters bedrijven ongeveer $7.900 per minuut kosten. Sterker nog, 93% van de bedrijven met datacenters die tien dagen of langer down waren, gingen binnen een jaar failliet, en 40% stortte onmiddellijk in. En uit een ander onderzoek onder 41 geëvalueerde datacenters bleek dat de gemiddelde kosten van ongeplande storingen meer dan 179.000 dollar aan bedrijfsonderbrekingen, ongeveer 118.000 dollar aan verloren inkomsten en ongeveer 42.000 dollar aan productiviteit omvatten. Als managers van datacenters zich eenvoudigweg meer zouden concentreren op het onderzoeken en oplossen van de belangrijkste oorzaken van veelvoorkomende fouten, zouden ze de potentiële risico's aanzienlijk verminderen.

Redenen die tot het ineenstorten van het datacenter hebben geleid

Het probleem is dat veel datacenterexploitanten en exploitanten zich vaak meer richten op groei en omzet in plaats van het behouden en versterken van wat er al is. Als je tegenwoordig aandacht besteedt aan de beheerders van veel publieke en private datacenters, zul je zien dat ze zich vrijwel uitsluitend bezighouden met het vergroten van de opslagcapaciteit, het vergroten van de serverdichtheid en het verhogen van de serverdichtheid. Verouderde serverfarms ombouwen naar modernere faciliteiten met efficiëntere koelsystemen bijvoorbeeld. Hoewel dit alles geweldig en hard nodig is en een ongelooflijke groei laat zien in de dataopslagindustrie, laat het ook zien waarom datacenters steeds vaker falen.

In dit artikel onderzoeken we de veelvoorkomende redenen waarom datacenters zijn uitgeschakeld, en benadrukken we wat beheerders kunnen doen om deze problemen te minimaliseren of zelfs te elimineren, deze problemen volledig op te lossen en de stabiliteit van uw systeem te verbeteren.

Redenen die tot het ineenstorten van het datacenter hebben geleid

Fout veroorzaakt door mensen

Dit zijn de eenvoudigste oorzaken en ook een van de moeilijkst te vermijden. Simpel gezegd: iedereen kan fouten maken. Aangezien 22% van de storingen wordt veroorzaakt door menselijke fouten, is deze oorzaak de moeite waard om zorgvuldig te overwegen en, belangrijker nog, relatief eenvoudig te voorkomen.

Onjuiste systeemautorisatie

Redenen die tot het ineenstorten van het datacenter hebben geleid

In werkelijkheid hebben maar heel weinig beheerders volledige en onbeperkte toegang tot alle systemen in een datacenter. In plaats van deze toestemming aan meer mensen te verlenen, moet de toegang strak worden beheerd. Anders is het heel goed mogelijk dat er een ernstige fout in het systeem optreedt. Bij het Joyent-incident in 2014 startte een ervaren beheerder bijvoorbeeld per ongeluk alle virtuele machines in het oostelijke datacenter van het bedrijf met slechts een paar klikken opnieuw op.

Slechte back-upprocedures

Redenen die tot het ineenstorten van het datacenter hebben geleid

Bij het plannen van onderhoudstaken is het back-upproces een belangrijke maar vaak vergeten stap. Vaak worden processen gedocumenteerd maar niet grondig beoordeeld, en vaak worden zaken na onderhoud niet volledig in hun oorspronkelijke vorm hersteld.

Te veel veranderingen doorvoeren

Redenen die tot het ineenstorten van het datacenter hebben geleid

Als een beheerder tijdens onderhoud te veel wijzigingen in één keer probeert door te voeren, kan dit problemen veroorzaken. Ten eerste hebben beheerders vaak een gehaaste mentaliteit omdat ze in korte tijd een groot aantal taken moeten voltooien, wat vaak tot fouten leidt. Ten tweede wordt het oplossen van problemen na de wijziging veel moeilijker omdat er zoveel veranderingen in hetzelfde tijdsbestek plaatsvinden.

Lakheid op het gebied van personeelsbeheer

Redenen die tot het ineenstorten van het datacenter hebben geleid

Het klinkt een beetje hard, maar medewerkers moeten weten hoe ze de regels in het centrum strikt moeten volgen en moeten streng worden gedisciplineerd bij het overtreden ervan. In geen enkel datacenter kunnen medewerkers bijvoorbeeld eten of drinken terwijl ze aan het werk zijn, of moeten noodschakelaars duidelijk gelabeld en beveiligd zijn. Deze dingen lijken misschien klein, maar kunnen tot grote incidenten leiden. Zorg er dus voor dat de regels altijd strikt worden nageleefd.

Systeemfout

Back-upstroom is niet gegarandeerd, apparatuur is oud of verkeerd geconfigureerd.

Redenen die tot het ineenstorten van het datacenter hebben geleid

De meest voorkomende reden dat een datacenter uitvalt, is een stroomstoring. Stroomuitval kan op elk moment gebeuren. Daarom zijn datacenters ontworpen met back-upstroombronnen voor het geval de hoofdstroom uitvalt. Accu's of generatorsystemen worden vaak gebruikt als back-upstroom. Het probleem is dat de batterij mogelijk niet op tijd wordt vervangen en dat de generator mogelijk niet wordt geïnspecteerd en onderhouden, wat tot problemen kan leiden als de stroom uitvalt. Dit alles betekent dat uw back-upmogelijkheden mogelijk niet beschikbaar zijn wanneer u ze het meest nodig heeft.

In het geval van een stroomstoring gebruiken UPS-systemen batterijen als back-upstroom, waardoor ze een essentieel onderdeel vormen van het behoud van de uptime van datacenters. De batterij werkt echter niet altijd goed. Voer onderhoud uit dat door de fabrikanten zelf wordt aanbevolen om de gezondheid van de batterij te controleren. Minimaal elk kwartaal moeten de accu's worden geïnspecteerd op correcte installatie, ontlading en opladen. Dit omvat visuele inspecties, capaciteitscontroles en regelmatige monitoring via software of de UPS-leverancier zelf.

Bovendien kunnen hoge temperaturen de levensduur van de batterij van het systeem verkorten. Het bouwen van een speciale UPS-ruimte kan de slijtage van de levensduur van de batterij helpen verminderen. Vermijd ook dat u de accu regelmatig ontlaadt en zorg goed voor losse verbindingen of versleten connectoren. Kortom, UPS is een bijzonder belangrijk systeem; het vereist een redelijk ontwerp, correct gebruik en strikt onderhoud.

Storing in het koelsysteem

Redenen die tot het ineenstorten van het datacenter hebben geleid

Mechanische systemen in een datacenter verbruiken veel elektriciteit, wat betekent dat ze tijdens bedrijf een grote hoeveelheid warmte afgeven. Een datacenter kan na één minuut in gebruik een crematorium worden. Daarom is het koelsysteem zo belangrijk. En zelfs als u temperatuursensoren laat meten en waarschuwingen naar beheerders stuurt, moet u er zeker van zijn dat u voldoende tijd heeft om de back-upkoelingsprocedures van het centrum uit te voeren voordat alles smelt.

Bovendien zijn veel koelsystemen niet echt ontworpen om de verhoogde hitteniveaus in een modern datacenter met hoge capaciteit bij te houden. Ook hier geldt dat het in kaart brengen van situaties waarin uw datacenter op 100% capaciteit draait, kan helpen bij het plannen van betere koelsystemen in de toekomst. Het opzetten van waarschuwingssystemen voor systeemtemperatuurschommelingen is ook noodzakelijk. U kunt bepaalde software voor thermische modellering en sommige DCIM-systemen gebruiken. Bovendien zijn chemische koelmiddelen een betere keuze dan systemen op waterbasis.

Het automatische conversieproces werkt niet goed

Redenen die tot het ineenstorten van het datacenter hebben geleid

De meeste serviceproviders, organisaties en bedrijven hebben back-updatacenters die worden gebruikt voor productiedatacenters. Bij een stroomstoring in het primaire datacenter wordt automatisch het back-up datacenter gestart en wordt al het verkeer naar die back-upfaciliteit geleid. Als het goed wordt gedaan, moet het proces naadloos verlopen tot aan de eindgebruiker. Helaas werken automatische failovers vaak niet zoals verwacht. De gebruikelijke oorzaak voor dit probleem is een gebrek aan regelmatige tests. Zelfs kleine veranderingen in de productie-infrastructuur kunnen een grote impact hebben op geautomatiseerde failover. Daarom zullen bij het aanbrengen van wijzigingen in de infrastructuur de geautomatiseerde failover-procedures moeten worden getest om er zeker van te zijn dat er niets is afgeweken van het proces.

Verouderde hardware

Redenen die tot het ineenstorten van het datacenter hebben geleid

Alle hardware van elk systeem heeft een bepaalde levensduur. En hoe langer u een stuk hardware gebruikt, hoe groter de kans dat u problemen ondervindt. Iedereen weet dit, maar het komt vaak voor dat een belangrijke applicatie crasht, alleen maar omdat deze op 10 jaar oude hardware draait. Deze problemen ontstaan ​​vaak door een gebrek aan uitgebreide vervangings- en upgradeplannen voor nieuwe hardware- of softwareplatforms, of door een gebrek aan budget. Als het om geld gaat, kun je er niets aan doen. Maar als je gewoon zo lang mogelijk probeert te profiteren, kan er op elk moment een probleem optreden, en als dat toch gebeurt, kan de schade die door het probleem wordt veroorzaakt veel groter zijn.

Het brandblussysteem heeft een probleem met waterlekkage

Redenen die tot het ineenstorten van het datacenter hebben geleid

De meeste moderne datacenters maken gebruik van waterloze brandbeveiligingssystemen, zodat ze de apparatuur niet beschadigen als ze opzettelijk of per ongeluk worden geactiveerd. Maar veel oudere faciliteiten gebruiken nog steeds traditionele brandbeveiligingssystemen in hun datacenters. Veel waterlekken hebben tot grote storingen geleid.

De nooduitschakeling is per ongeluk geactiveerd

Redenen die tot het ineenstorten van het datacenter hebben geleid

Het hoge niveau van fysieke beveiliging in de meeste datacenters schrikt dieven niet alleen af. Ze zijn er ook om te voorkomen dat medewerkers niet begrijpen hoe een datacenter werkt. Een applicatiebeheerder loopt bijvoorbeeld het datacenter binnen en activeert per ongeluk een noodstroomuitschakeling (EPO). EPO is een grote rode knop, die verantwoordelijk is voor het uitschakelen van de stroom naar het hele systeem. En voor degenen die het niet begrijpen of geen expertise hebben, is dergelijke verwarring uiteraard heel goed mogelijk.

Onder cyberaanval, ddos

Redenen die tot het ineenstorten van het datacenter hebben geleid

Door de jaren heen zijn cyberaanvallen een van de belangrijkste oorzaken van het falen van datacenters geworden, van slechts 2% in 2010 tot 22% in 2016. Operators Datacenters moeten actie ondernemen om systemen op te zetten om de risico's van aanvallen vroegtijdig te detecteren en te beperken.

Datacenters zijn lastig te verdedigen tegen een grootschalige DDoS-aanval . De meeste ISP's bieden enige bescherming op laag 3 en 4 van het netwerk, maar uw services hebben aanvullende bescherming nodig op laag 7, die specifiek kan worden aangepakt via HTTP GET of oproepen van een soortgelijke aanval. Mitigatieservices zoals firewalls, IPS/IDS en DDoS kunnen worden gecombineerd om verkeer om te leiden.

Natuurramp

De recente toename van stormen en overstromingen kan aanzienlijke verstoringen van datacenters veroorzaken. In 2010 hebben zich in de Verenigde Staten ruim 250 natuurrampen voorgedaan. Volgens statistieken leed de staat New Jersey in de VS $63,9 miljard aan verliezen als gevolg van bedrijfsonderbrekingen veroorzaakt door de superstorm Sandy in 2012.

Stappen om de schade veroorzaakt door ‘instortingsincidenten’ van datacenters te beperken

Als de stilstand voor routineonderhoud zorgvuldig wordt gepland en klanten vooraf worden gewaarschuwd voor stilstand van het centrum, vooral tijdens een periode met weinig verkeer, zullen de klanten sympathieker zijn en zal de schade aanzienlijk worden verminderd. De grootste schade treedt op als deze onverwachts optreedt, en vooral als deze lang duurt, en er extra problemen ontstaan. Houd het resourcesysteem van het hele bedrijf stabiel, zodat werknemers hun werk effectief kunnen doen, waardoor de last voor IT-afdelingen wordt verminderd.

Specifiek:

  • Maak een back-up van uw gegevens: als u te maken krijgt met een datacenterstoring, moeten uw gegevens (en, nog belangrijker, de gegevens van uw klanten) gereed zijn wanneer u begint. Begin met het oplossen van problemen en voer het programma opnieuw uit. Door regelmatig back-ups te maken, beperkt u het risico op een echte meltdown. Als uw bedrijf het zich kan veroorloven, kunnen sommige producten, zoals de VPLEX-productlijn van EMC of de back-up- en replicatiesoftware van VEEAM, de downtime helpen minimaliseren door automatisch over te schakelen naar een back-uplocatie.
  • Zorg voor regelmatige monitoring van het serversysteem: Monitoring is een dienst die u regelmatig kunt uitvoeren en die doorgaans niet al te veel kost. Een monitoringservice van derden brengt u op de hoogte van mogelijke serveruitval, zodat u het probleem onmiddellijk kunt oplossen.
  • Minimaliseer menselijke fouten: wees voorzichtig wanneer u werkt of rondloopt in serversystemen of elektrische bedrading om te voorkomen dat u deze per ongeluk beschadigt, of raak eenvoudigweg geen mysterieuze schakelaars aan zonder uw expertise. Houd vloeistoffen uit de buurt van mechanische systemen. Bel een specialist op het gebied van gegevensbescherming wanneer een server moet worden geüpgraded of onderhouden, en houd u aan de regels van het centrum.

Elk datacenter, van kleine centra tot faciliteiten en dienstverleners op ondernemingsniveau, moet er 100% naar streven om betrouwbare diensten aan gebruikers te bieden. Door de tijd te nemen om plannen te maken voor de toekomst en daarbij de principes op het gebied van onderhoud en menselijke factoren te volgen, kan uw datacenter enkele van de meest voorkomende oorzaken van storingen vermijden: uitvalproblemen.

Bekijk meer

Laat een reactie achter

Hoe u de kennisgeving van een auteursrechtverzoek in de rechterhoek van het scherm op Windows 10 verwijdert

Hoe u de kennisgeving van een auteursrechtverzoek in de rechterhoek van het scherm op Windows 10 verwijdert

Ziet u een activeringsmelding voor Windows 10 in de rechterhoek van het scherm? In dit artikel wordt uitgelegd hoe u de kennisgeving van een auteursrechtverzoek op Windows 10 verwijdert.

Instructies van AZ voor het installeren van Windows 10 build 14393.222

Instructies van AZ voor het installeren van Windows 10 build 14393.222

Onlangs heeft Microsoft de nieuwste cumulatieve update voor Windows 10 pc-gebruikers uitgebracht, genaamd Build 14393.222. Deze update voor Windows 10 repareert voornamelijk bugs op basis van gebruikersfeedback en verbetert de prestatie-ervaring van het besturingssysteem.

Bescherm uw computernetwerk met Bastion host in slechts 3 stappen

Bescherm uw computernetwerk met Bastion host in slechts 3 stappen

Heeft u computers op uw lokale netwerk die externe toegang nodig hebben? Het gebruik van een bastionhost als poortwachter voor uw netwerk kan een goede oplossing zijn.

3 manieren om snel alle gebeurtenislogboeken in Windows 10 te wissen

3 manieren om snel alle gebeurtenislogboeken in Windows 10 te wissen

Soms moet u oude gebeurtenislogboeken in één keer verwijderen. In deze handleiding laat Quantrimang.com u 3 manieren zien om snel alle gebeurtenislogboeken in Windows 10 Event Viewer te verwijderen.

Hoe u een Windows-toets maakt als uw toetsenbord niet beschikbaar is

Hoe u een Windows-toets maakt als uw toetsenbord niet beschikbaar is

Als je liever een oud klassiek toetsenbord gebruikt, zoals het IBM Model M, dat geen fysieke Windows-sleutel bevat, kun je er eenvoudig meer toevoegen door een sleutel te lenen die je niet vaak gebruikt.

Hoe u een transparante achtergrondmodus creëert op Windows 10

Hoe u een transparante achtergrondmodus creëert op Windows 10

WindowTop is een tool waarmee u alle toepassingsvensters en programma's op computers met Windows 10 kunt dimmen. Of u kunt een donkere achtergrondinterface op Windows gebruiken.

Valse IP-methoden helpen u anoniem toegang te krijgen

Valse IP-methoden helpen u anoniem toegang te krijgen

In veel eerdere artikelen hebben we vermeld dat online anoniem blijven uiterst belangrijk is. Elk jaar lekt privé-informatie uit, waardoor online beveiliging steeds noodzakelijker wordt. Dat is ook de reden dat we virtuele IP-adressen moeten gebruiken. Hieronder zullen we leren over methoden om nep-IP's te maken!

Hoe u de taalbalk op de taakbalk van Windows 8 uitschakelt

Hoe u de taalbalk op de taakbalk van Windows 8 uitschakelt

De Taalbalk op Windows 8 is een miniatuurtaalwerkbalk die is ontworpen om automatisch op het bureaublad te worden weergegeven. Veel mensen willen deze taalbalk echter op de taakbalk verbergen.

Tips om de internetverbindingssnelheid van Linksys te optimaliseren

Tips om de internetverbindingssnelheid van Linksys te optimaliseren

Het maximaliseren van de internetsnelheid is essentieel voor het optimaliseren van uw netwerkverbinding. U kunt een optimale entertainment- en werkervaring hebben met behulp van computers, internet-tv's, gameconsoles, enz.

Hoe u WEP, WPA, WPA2 instelt voor de Linksys-router

Hoe u WEP, WPA, WPA2 instelt voor de Linksys-router

Draadloze connectiviteit is tegenwoordig een noodzaak en daarom is draadloze beveiliging essentieel om de veiligheid in uw interne netwerk te garanderen.