Amazon: Too Big to Fail?

Door

22 maart 2017

Begin Maart kwam Public Cloud in een slecht daglicht door een storing bij Amazon. Menig journalist kroop in de pen om met gevatte koppen, zoals “Amazon Cloud gaat de mist in” aan te geven hoe kwetsbaar het internet is.

Er werd aangehaald dat het wereldwijde web onderuitging ten gevolge van deze storing en dat het herstel meer dan vier uur duurde. Er is blijkbaar niemand die het op durft te nemen voor deze Cloud Service Provider in minder goede tijden. Dit, terwijl public cloud-diensten niet meer weg te denken zijn uit onze huidige maatschappij. Dit soort diensten zijn al jaar en dag (en nacht) beschikbaar voor eenieder die er gebruik van wil maken.

Hoge bomen

Amazon.com startte zijn activiteiten in juli 1995. Aanvankelijk verkocht Amazon.com alleen boeken. Later werden daar andere media aan toegevoegd en tot slot ook andere goederen. Ondertussen is AWS een van de grootste aanbieders van clouddiensten ter wereld. En u kent vast nog het spreekwoord “hoge bomen vangen veel wind”. Vandaar dat er vaak met de vinger wordt gewezen als het een keer goed mis gaat. Immers: er is geen beter vermaak dan leedvermaak, niet?

Misschien toch eerst even een rechtzetting. Het is niet het internet zelf dat onderuit is gegaan tijdens deze storing. Wel een groot deel van de virtuele servers die op hun beurt heel wat belangrijke clouddiensten en applicaties laten draaien. Daarom leek het er volgens velen op dat het world wide web er de brui aan had gegeven, nog voordat de lente in ons land was. En wie wilde weten wat er nu eigenlijk aan de hand was werd op de statuspagina van AWS ook niet veel wijzer. Die was zelf ook offline.

Downtime-in-cloud

Een andere pakkende kop als gevolg van de uitval was “Storing bij Amazon te wijten aan typefout”. Het begon blijkbaar met iets banaals. Omdat het subsysteem van de cloudopslagdienst AWS Simple Storage Service (S3) traag werkte, wilde een medewerker enkele servers van S3 offline halen. “Eén commando werd echter verkeerd ingegeven, waarna veel meer servers verwijderd werden dan de bedoeling was”, legt Amazon Web Services uit in een verklaring. Als gevolg moesten flink wat servers volledig herstart worden. Intussen is Amazon S3 zo groot geworden zodat het hele proces veel langer duurde dan de Cloud Provider had verwacht. Amazon belooft nu een hele rits maatregelen die moeten garanderen dat dergelijke storingen niet meer kunnen voorkomen.

Human error

Dit hele gebeuren zet ons wel aan het denken. Het bewijst wederom dat de “human error” nog steeds de meest voorkomende is van alle zaken die mis kunnen gaan in het datacenter. En dus in de cloud. Maar de vraag blijft: hoe heeft dit kunnen gebeuren. En vooral: hoe kan men dit in de toekomst voorkomen? Wellicht dat artificiële intelligentie door middel van robots een oplossing kan bieden, maar die moeten dan wel eerst geprogrammeerd worden door een mens en typefouten zijn blijkbaar snel gemaakt 😉

Aanvaarden

Laten we eens kijken wat de gemiddelde downtime was van alle wereldwijde clouddiensten bij elkaar in het afgelopen jaar. Cloudharmony, een bedrijf dat onderdeel uitmaakt van Gartner en dat continue Cloud Providers meet en de totale downtime in kaart brengt, houdt dat bij. We leren dan, dat de tijd dat alle wereldwijde Clouddiensten niet beschikbaar waren varieerde tussen de 2 minuten en 2.5 uur per cloud provider.

Dat lijkt veel, maar over alle servers heen gemeten over 365 dagen is dit een knappe prestatie. Als u als CIO of IT Manager dit soort cijfers op jaarbasis kan garanderen binnen uw bedrijf, dan zal men dit meestal en afhankelijk van uw business wel aanvaarden, niet? Kortom ik zie het de beheerders van een on-premises omgeving niet veel beter doen, uitzonderingen nagelaten. Maar ook hier geldt dat alles zijn prijs heeft en dat redundante oplossingen vaak noodzakelijk zijn om de downtime tot een minimum te beperken.

Downtime

Nu is gebleken wat de werkelijke oorzaak was – Amazon dit beaamde – vraag ik mij soms af of wij als gebruikers van clouddiensten niet té afhankelijk zijn geworden? Of hebben de IT-afdelingen die ons land telt zich er te gemakkelijk van afgebracht onder lichte druk van het management met de melding “zet het maar in de Public Cloud want dat is trendy en kost een pak minder”? Niets blijkt minder waar, want ook de big 5 van de Cloud Providers kunnen het laten afweten, zoals is gebleken. En dit was geen alleenstaand feit.

Het beste is dan ook (en dit schrijf ik in opperbeste Paas-stemming) om “niet al uw eieren in één mandje te leggen. Zelfs niet in de Cloud. Mijn advies is dan ook om eerst alle mogelijke oplossingen te onderzoeken voordat uw bedrijfskritische applicaties uit gaat besteden. En om optimaal gebruik te maken van de back-up opties die de Cloud Service Provider meestal aanbiedt. Ook al is dit tegen een meerprijs. Een hybride Cloud oplossing kan hier het perfecte antwoord bieden om geleidelijk uw data en applicaties te verhuizen naar de Cloud. Onthoud echter dat geen enkel systeem onfeilbaar is. Er moet altijd een plan B zijn in al uw strategische IT-beslissingen.

Peter Witsenburg – Cloud Makelaar

Amazon: Too Big to Fail?

Hoge bomen

Downtime-in-cloud

Human error

Aanvaarden

Downtime

LAAT EEN REACTIE ACHTER

Klantcases

Claranet migreert ERP-applicatie van Kerridge CS naar eigen IaaS-platform

CORPUS optimaliseert bedrijfsvoering met workforcemanagementsoftware van Dyflexis

Woningcorporatie KleurrijkWonen zet in op Security Awareness

ICT voor sterk onderwijs en een betekenisvolle toekomst

SoftwareOne gaat samenwerking met ICN Solutions aan voor klanten met Autodesk...

Populaire categorieën