Awaria AWS przetoczyła się przez internet, paraliżując dziesiątki serwisów

Usługi chmurowe są dziś podstawą działania bardzo wielu serwisów internetowych. Mało który dostawca usług korzysta jednak z własnej infrastruktury – taniej i łatwiej jest wykupić moc obliczeniową i przestrzeń od któregoś z wielkich dostawców. W rezultacie znaczna część internetu działa na serwerach AWS (Amazon Web Services), Microsoft Azure, Google Cloud Platform. Problem pojawia się wtedy, gdy któryś z dostawców ma problemy, tak jak to było dziś w przypadku Amazonu.
...

Kłopoty AWS sparaliżowały spory wycinek internetu na całym świecie

Epicentrum tego cyfrowego trzęsienia ziemi znajdowało się w regionie US-EAST-1 w Północnej Wirginii. To właśnie tam rozpoczęła się kaskada problemów, która szybko rozprzestrzeniła się na globalną skalę. Problem dotyczył usługi DynamoDB, która pełni rolę fundamentu dla tysięcy aplikacji – gdy ta w pełni zarządzana baza danych NoSQL przestała funkcjonować prawidłowo, efekt domina objął dziesiątki innych usług i Rozległa awaria Amazon Web Services rozlała się po Internecie, obejmując także serwisy w Polsce.

Lista platform, które doświadczyły problemów, jest naprawdę długa – wśród poszkodowanych znalazły się najpopularniejsze serwisy rozrywkowe jak Apple Music, Disney+, HBO Max i Netflix, platformy dystrybucji gier Epic i Steam, społecznościowe Reddit, Strava, Pinterest i Snapchat, narzędzia pracy takie jak Canva i ChatGPT. W Polsce awaria dotknęła między innymi mBank i Pocztę Polską.

AWS

Co ciekawe, nieodporne na problemy AWS okazały się także programy i usługi Microsoftu, korzystające z chmury Azure, co tylko dowodzi, jak skomplikowane są zależności między usługami i jak łatwo zaburzyć równowagę wymaganą do sprawnej pracy.

Czytaj też: Test Huawei Watch Ultimate 2 – czy ten zegarek potrzebował następcy?

Historia lubi się powtarzać

Region US-EAST-1 ma już swoją niechlubną tradycję spektakularnych awarii. W 2017 roku błąd operatora spowodował paraliż usługi S3, który wyłączył znaczną część internetu na kilka godzin. W grudniu 2021 roku doszło do dwóch poważnych awarii w odstępie zaledwie trzech dni, co pokazuje, że problemy w tym regionie nie są odosobnionymi incydentami. Amazon oczywiście potwierdził, że pracuje nad wieloma ścieżkami naprawy i obserwuje oznaki poprawy sytuacji. Podstawowy problem z systemem DNS został jednak rozwiązany, a firma zaleca klientom czyszczenie pamięci podręcznych DNS w przypadku utrzymujących się trudności.

Dzisiejsza awaria doskonale pokazuje ryzyko nadmiernej koncentracji usług w rękach kilku podmiotów. AWS kontroluje około jednej trzeciej globalnego rynku chmury publicznej – to jeszcze nie monopol, ale jak przekonał się Microsoft, rozlewająca się fala kłopotów nie robi wyjątków dla Azure.