Amazon har bekräftat att det omfattande driftstopp som på måndagen slog ut stora delar av Internet nu är åtgärdat. Felet låg hos Amazon Web Services (AWS), världens största molnleverantör och den infrastruktur som en stor del av nätet vilar på.
Driftstörningen beskrivs som den värsta sedan fjolårets incident med CrowdStrike. Enligt Reuters orsakade felet global oreda, och över 28 olika AWS-tjänster påverkades. Analytiker uppskattar att de ekonomiska skadorna kan uppgå till flera miljarder dollar.
Appar
Appar som Snapchat, Signal och Reddit slutade fungera. Flygtrafik försenades, banker och betaltjänster slogs ut och spel som Fortnite gick inte att nå. Även Amazons egna tjänster drabbades, däribland e-handeln, Alexa och Prime Video. För miljoner företag innebar avbrottet att system låg nere, anställda inte kunde logga in och betalningar inte kunde tas emot.
Enligt Mehdi Daoudi, vd för övervakningsföretaget Catchpoint, visar incidenten hur sårbart Internet är och hur beroende hela samhället har blivit av det. Han uppskattar att de ekonomiska konsekvenserna kan uppgå till hundratals miljarder dollar, genom förlorad produktion och stoppade verksamheter – från flygbolag till fabriker.
Felet uppstod i Amazons största och äldsta amerikanska serveranläggning, som används som standardregion för många AWS-tjänster. Samma anläggning har haft problem tidigare, både 2020 och 2021, men då försäkrade företaget att problemen var lösta.
Felloggar
Enligt ZDNet började allt med ökade felloggar och fördröjningar i flera centrala tjänster, kopplade till företagets databasteknik. Ingenjörer identifierade till slut ett DNS-problem som grundorsak och rättade till det, men då hade redan fler än två dussin AWS-tjänster slagits ut.
Vid avbrottets topp rapporterade Down Detector över åtta miljoner felanmälningar globalt.
Ken Birman, professor i datavetenskap vid Cornell University, menar att utvecklare måste bygga bättre system för felhantering. Han kritiserar företag som försöker spara tid och pengar genom att hoppa över viktiga steg i sin infrastruktur, och som sedan inte klarar större driftstörningar.
För Amazon innebär händelsen en risk för tappat förtroende. Om kunder, särskilt inom finanssektorn, börjar söka sig bort kan det slå hårt mot bolagets affär. Allt fler experter förespråkar nu så kallade multicloud-lösningar – där kritiska system delas upp mellan flera stora leverantörer som AWS, Microsoft Azure och Google Cloud – för att minska risken för framtida totalstopp.
Källa:
Ars Technica