Awaria kontrolowana. Czy stać Cię na awarię serwera?
8:20 - nie działa internetowy system sprzedaży biletów PKP Intercity. Mogło się zdarzyć? Oczywiście, że tak. Niemniej, przez 5 kolejnych godzin, bilety można było kupić tylko u konduktora lub w kasie biletowej. To już zdecydowanie odbiegało od standardów. Co więcej, do późnego wieczora system działał wadliwe i zdarzało się, że wyrzucał ludzi ze strony PKP Intercity.
Efekt końcowy
Duża, nazwijmy ją dyplomatycznie, niedogodność nabycia biletów, spowodowana była awarią serwera odpowiedzialnego za system sprzedaży. Czy takie tłumaczenie uspokoiło ludzi, którzy godzinami próbowali załatwić swoją sprawę? Z całą pewnością nie! Co więcej, takie tłumaczenie nawet nie powinno ich obchodzić. Ich interesuje efekt końcowy, a awarię trwającą ponad 5 godzin naprawdę trudno sensownie usprawiedliwić. Ten konkretny przypadek dotyczył PKP Intercity, jednak schemat zachowań niezadowolonych (jakby nie było) klientów jest uniwersalny. Problemy z serwerem, szczególnie tak długotrwałe, w przypadku jakiejkolwiek firmy oferującej usługi online, to realna strata finansowa. Klient nie mogąc dokonać zakupu w jednym miejscu, bez najmniejszego problemu znajdzie 10 innych. Czas to pieniądz - proste.
Przezorny zawsze zabezpieczony
Awarie zdarzały się, zdarzają i będą zdarzać. Odpowiedzialne firmy uwzględniają ten stan rzeczy w swoich działaniach. Myślą "przed", nie "w trakcie". To pozwala skrócić czas usuwania awarii do niezbędnego minimum. Warto więc mieć przygotowane dwa bardzo ważne plany: DRP i BCP!
DRP - Disaster Recovery Plan
Najważniejszy dokument w przypadku wystąpienia awarii. Opisuje całość rozwiązania - łącznie z analizą ryzyka oraz schematem organizacyjnym dla projektu w rozróżnieniu na czas pracy "normalnej" i tej podczas awarii. To plan zawierający procesy związane z wznowieniem lub utrzymaniem infrastruktury technicznej po wystąpieniu sytuacji krytycznej.
BCP - Business Continuity Plan
Plan ciągłości zasobów to nic innego jak działania w zakresie tworzenia, weryfikacji i aktualizacji planów wznawiania w obszarze kluczowych procesów organizacji, w przypadku na przykład wystąpienia awarii.Warto zaznaczyć, że samo wystąpienie awarii nie jest dla przeciętnego użytkownika Internetu czymś zaskakującym i... wybitnie irytującym. Internauta - też człowiek! Niemniej, nie należy nadużywać jego cierpliwości. Brak jasnej informacji, opieszałość są niedopuszczalne i bardzo często również... niewybaczalne. Analogicznie - szybka, sprawna reakcja w przypadku awarii, na pewno zostanie zauważona!