Disaster Recovery je viac než len zálohovanie

Väčšina organizácií používa pre svoju prevádzku nejaký druh softvéru – prevádzkovaný vo vlastnej serverovni alebo v cloude. A taktiež má spracovaný havarijný plán. Je to podobné ako bežná poistka – nikto o nej nepremýšľa až do okamihu, kedy nastane poistná udalosť. Spravidla až vtedy sa ukáže, či je poistné krytie dostatočné a naše riziko zabezpečené.

Bez adekvátneho havarijného plánu nie je jasné, aký dopad bude pre organizáciu znamenať výpadok softvérového riešenia. Pre niekoho môže znamenať finančnú stratu, pre “online” firmy je to častokrát otázka prežitia.
Havarijný plán a s ním súvisiace opatrenia, akým je napríklad záložná IT infraštruktúra sú nákladné riešenia, ktoré fungujú ako poistka pre prípad zlyhania systému. Mnoho firiem sa však spolieha na to, že ku obnove im postačuje mať zálohu údajov a pokrytie hardvéru zárukou, resp. servisnou službou od IT dodávateľa. Zálohovanie údajov sa často označuje ako havarijný plán. Rozdiel medzi zálohou údajov a skutočným Disaster recovery riešením je však značný:

Záloha údajov (Backup): chráni pred stratou informácie spôsobenou napríklad nechceným vymazaním, úpravou, nekorektným zápisom do databázy a podobne. Cieľom zálohy údajov je mať k dispozícii predchádzajúcu verziu informácie v čase. Schopnosť vrátiť sa ku predošlej verzii je kritická, nerieši však situácie, kedy okrem informácie zlyhá aj softvérová aplikácia využívajúca konkrétnu informáciu.

Archivácia údajov: Sa spravidla využíva z legislatívnych dôvodov pre dlhodobé uloženie citlivých dát (napr. registratúra, účtovníctvo, dokumenty).

Havarijný plán (Disaster recovery - DR): znamená schopnosť obnoviť poslednú verziu informácie do predchádzajúceho stavu a mať ju k dispozícii okamžite alebo v čo najkratšom čase. Dôvodov pre výpadok môže byť viacero – od nesprávneho konfiguračného zásahu, cez zlyhanie hardvéru, až po haváriu spôsobenú požiarom či inou mimoriadnou udalosťou. Takto koncipované systémy sa zvyknú označovať ako High Availability (HA).
Implementácia havarijného plánu do praxe si vyžaduje detailné poznanie potrieb v organizácii, zhodnotenie rizík a ich možných dopadov. Je potrebné poznať vzájomné súvislosti medzi systémami, nastaviť úroveň redundancie, zvážiť využitie inej geografickej lokality. Treba brať do úvahy aj legislatívu upravujúcu narábanie s citlivými údajmi v systémoch. Rovnako zvážiť či je postačujúca asynchrónna replikácia s určitým časovým oneskorením, alebo je nevyhnutné vybudovať synchrónnu replikáciu, fungujúcu v reálnom čase?

Riešenia pre DR je možné budovať on-premise, v cloude alebo ako hybridné riešenie. Vybudovanie DR systému on-premise si vyžaduje geograficky inú lokalitu, kde je potrebné nasadenie výkonovo adekvátnej infraštruktúry, softvérových licencií a konektivity. Je to najdrahší spôsob ako si uvedenú funkčnosť zabezpečiť. Môžu si ho dovoliť iba veľké organizácie, ktoré takto navyše dokážu rozložiť aj vyžaženie systémových zdrojov.

Riešenie DR v cloude, označované aj ako DRaaS (Disaster Recovery as a Service) svojou filozofiou plne vyhovuje podmienke vzdialenej geografickej lokality. V tomto prípade sa prostredníctvom replikačného nástroja vytvára replika v Disaster Recovery cloud-e. Opäť sa rozhoduje, či sa údaje budú replikovať synchrónne alebo asynchrónne.

Najjednoduchšie je vytvorenie DR v prípade, ak už je informačný systém v cloude. Tu postačuje replika v záložnom dátovom centre. Túto si rieši priamo poskytovateľ cloudových služieb.

VMware site recovery manager - Ukážka riešenia typu DR na báze produktov VMware

 

Pri samotnom návrhu DR sa často používajú dva termíny: RPO a RTO. Sú to dôležité kritériá, podľa ktorých sa definujú kritériá na záložnú infraštruktúru a aj samotný systém replikácie.

RPO (Recovery Point Objective) hovorí o tom, ako dlho budú historické dáta archivované a v akej periodicite. Môžete sa napríklad rozhodnúť, že denná záloha údajov bude uchovávaná počas jedného týždňa, týždenná záloha počas jedného mesiaca a mesačná záloha počas jedného roka. Jedna vec však musí byť jasná už od začiatku: akým spôsobom bude záloha, resp. replika vykonávaná a aká strata údajov (od poslednej zálohy až po haváriu systému) je akceptovateľná. Je napríklad 15 minút akceptovateľná doba straty údajov? Pri e-mailovom systéme zrejme áno, pri mission critical aplikácií zrejme nie.

RTO (Recovery Time Objective) je časový úsek, počas ktorého musí po výpadku hlavného systému byť plne k dispozícii záložný systém. Inak povedané, aký čas môžeme byť bez fungujúceho informačného systému, aby nám nevznikla ekonomicky neúnosná strata ? Opäť pre porovnanie – e-mail nedostupný počas jednej hodiny je zrejme akceptovateľný, ale online obchod pre zákazníkov s denným obratom v tisíckach EUR zrejme nie.
Vybudovanie optimálneho DR riešenia nie je jednoduché. Vždy sa odporúča riešiť zvýšenú odolnosť voči výpadkom už v primárnom riešení. Ak je prijaté rozhodnutie o vybudovaní DR riešenia, využitie DRaaS služieb v dátovom centre je vždy efektívnejšie než budovanie internej záložnej infraštruktúry. Väčšina poskytovateľov cloud služieb disponuje softvérovými nástrojmi bežne využívanými v podnikoch, a dokážu plne podporovať replikáciu údajov do cloudu. Medzi takéto nástroje patrí napríklad: Veeam Availability Suite, Vmware Site Recovery Manager, alebo Acronis Disaster Recovery Service.
 

GAMO a.s.  |  Kyjevské námestie 6  |  974 04 Banská Bystrica
Dátové centrum  |  Datacube  |  Kopčianska 92  |  851 01 Bratislava
Copyright © 2017 GAMO
Created by ActivIT.