Przeczytasz w 3 min.
Przeczytano 615 razy
Ostatnia aktualizacja 2025-04-25

Awaria chmury Google - co się wydarzyło w centrum danych w Ohio?

Google padło na kilka godzin

Pod koniec marca 2025 roku w jednym z centrów danych Google w regionie Columbus (Ohio) doszło do niespodziewanej awarii, która ujawniła, jak bardzo nawet najbardziej zaawansowane systemy mogą być bezbronne wobec jednego słabego ogniwa. Przez sześć godzin ponad 20 usług Google Cloud było niedostępnych, a pełne przywrócenie infrastruktury zajęło niemal dwie doby.

Przyczyną incydentu – jak się właśnie oficjalnie potwierdziło – był uszkodzony akumulator w systemie zasilania awaryjnego. W efekcie zawiodły nie tylko podstawowe źródła prądu, ale i zabezpieczenia, które miały je zastępować.

Kłopotliwy zasilacz w centrum cyfrowego świata

Awaria rozpoczęła się 29 marca o godzinie 12:54 czasu PST. Problem dotyczył strefy us-east5-c – jednej z dostępnościowych stref usług Google Cloud. Wśród niedostępnych systemów znalazły się m.in. Google Compute Engine, Cloud SQL, BigQuery i Kubernetes Engine. Jak się później okazało, zawiódł jeden z akumulatorów UPS (Uninterruptible Power Supply), który miał zapewnić ciągłość zasilania do momentu włączenia się generatorów awaryjnych.

Nie dość, że zasilacz nie zadziałał, to prawdopodobnie zablokował automatyczne przełączenie się systemu na tryb awaryjny. Dopiero ręczna interwencja inżynierów pozwoliła na obejście usterki i uruchomienie generatorów diesla.

Naprawa trwała dłużej niż zakładano

Choć część usług zaczęła wracać do działania już po dwóch godzinach, wiele z nich wymagało indywidualnego restartu. Pełne przywrócenie funkcjonalności zakończyło się dopiero 1 kwietnia nad ranem.

Google opublikowało szczegółowy raport z incydentu, przepraszając klientów i zapowiadając modernizację infrastruktury zasilającej. Firma nie ujawniła jednak nazwy producenta feralnego systemu UPS ani szczegółowych ustaleń dotyczących przyczyn awarii.

Wnioski na przyszłość – technologia to nie wszystko

Zdarzenie z marca 2025 roku po raz kolejny pokazało, że awarie systemów IT nie zawsze wynikają z błędów oprogramowania. Często źródłem problemów są pozornie stabilne elementy infrastruktury – jak właśnie zasilacze, systemy chłodzenia czy błędy w konfiguracji.

Chociaż Google, Amazon Web Services i Microsoft Azure inwestują ogromne środki w zabezpieczenia, żadna infrastruktura nie jest w pełni odporna na awarie. Przykłady z ostatnich lat – od eksplozji sprzętu w centrach danych po globalne zakłócenia wywołane aktualizacją oprogramowania – pokazują, jak delikatna bywa nowoczesna sieć IT.

Czytaj także:

Zabezpieczenie urządzeń elektrycznych przed powodzią – co warto wiedzieć i jak się przygotować?

Zabezpieczenie urządzeń elektrycznych przed powodzią – co

Wrześniowa powódź w 2024 roku w południowej Polsce zniszczyła tysią

Więcej
Nowa era magazynowania energii – niepalne akumulatory

Nowa era magazynowania energii – niepalne akumulatory

Przełom w bezpieczeństwie i ekologii magazynowania energii. Niepaln

Więcej
Akumulator przyszłości? Ładowanie w minutę i żywotność na dekady

Akumulator przyszłości? Ładowanie w minutę i żywotność na

Czy wyobrażasz sobie akumulator, który ładuje się w minutę i działa

Więcej
Sterowanie roletami w nowoczesnym domu. Jak działa inteligentny silnik Extralink?

Sterowanie roletami w nowoczesnym domu. Jak działa inteli

Nowoczesny dom nie musi być drogi ani skomplikowany. Sprawdź, jak d

Więcej
Ochrona fotowoltaiki przed przepięciami – jak działa warystorowy ogranicznik SPMO40C\2P‑PV1000

Ochrona fotowoltaiki przed przepięciami – jak działa wary

Przepięcia mogą zniszczyć inwertery i panele PV. Sprawdź, jak warys

Więcej
Modułowy przekaźnik półprzewodnikowy SSR-5A-D. Ciche, beziskrowe sterowanie obciążeniem do 5 A

Modułowy przekaźnik półprzewodnikowy SSR-5A-D. Ciche, bez

Przekaźnik półprzewodnikowy SSR-5A-D to nowoczesne urządzenie do be

Więcej