Zavřít
Vstúpiť Nasledujte nás

3S.sk

Odborná sekcia

Definícia a rotácie záloh

27.02.2012, 12:38

Jedným z kľúčových prvkov každého zálohovania dát je určenie rotačnej schémy tak, aby bola zaručená ochrana minimálne jeden deň spätne. Najlepšia rotačná schéma médií je taká, ktorá zaručí čo možno najdlhšie, najrozsiahlejšie a najrôznorodejšie kópie podnikových dát.

Oproti Tape-A-Day schémy, napríklad keď prepisujeme dáta z predošlého dňa zálohou nasledujúceho dňa, toto zálohovanie považujme za najmenej bezpečné a užitočné.

Zálohovanie dát a ich následné uchovanie po dobu viac ako jedného dňa je nevyhnutné.  Avšak, náklady alebo čas potrebné pre každodennú plnú zálohu môžu byť nepraktické, zvlášť potom pre spoločnosti z väčším množstvom podnikových dát. Mnoho užívateľov z toho dôvodu vykonáva buď rozdielové alebo inkrementálne zálohy po väčšinu pracovných dní.

Typy záloh

Plná záloha (full backup) - u plnej zálohy sú zvolené súbory zálohované a súčasne je u nich odstránený atribút Archive. Atribút slúži pre rozlíšenie už zazálohovaných a nezazálohovaných dát. Pri zmene obsahu súboru je atribút Archive znova nastavený. Plné zálohy sú väčšinou predstupňom pre použitie záloh typu Incremental a Differental, s ktorých pomocou je možné šetriť čas potrebný na vykonanie zálohy. Pokiaľ je pre zálohovanie použitá plná záloha, pre obnovu pôvodného stavu dát stačí iba obnovenie tejto jedinej zálohy.

Inkrementálna záloha (incremental backup) – u zálohy typu icremental sú zálohované len súbory, pri ktorých je nastavený atribút Archive, pričom tento atribút je u nich po zálohovaní odstránený. Zálohujú sa tak iba súbory, ktoré boli zmenené (alebo u ktorých bol od poslednej plnej zálohy ručne nastavený atribút Archive). Záloha je podstatne kratšia ako u plnej zálohy, preto sa používa spravidla pre zálohovanie počas pracovného týždňa. Zo zálohy typu Incremental nepostačuje pre obnovu stavu obnova iba tejto zálohy. V prípade havárie servera alebo diskového poľa je nutné najprv obnoviť poslednú plnú zálohu a neskôr v časovom slede všetky zálohy typu Incremental od najstaršej až po najnovšie vytvorené v období po poslednej plnej zálohe. Z toho vyplýva, že inkrementálne zálohy sú síce rýchlejšie na vytvorenie, čas obnovy je však vďaka nutnosti obnovy z niekoľkých rôznych zálohovacích súprav dlhšia. Pravdepodobnosť veľkej havárie však nie je toľko pravdepodobná, preto výhody inkrementálneho zálohovania určite využijete.

Rozdielová záloha (differential backup) – u rozdielovej zálohy sú zálohované len súbory, pri ktorých je nastavený atribút Archive, pričom tento atribút u nich nie je po zálohovaní odstránený. Zálohujú sa tak iba súbory, ktoré boli zmenené či u nich bol od poslednej plnej zálohy ručne nastavený atribút Archive. Záloha je podstatne kratšia ako u typu full backup, preto ju možno podobne ako u inkrementálnej zálohy používať pre zálohovanie počas pracovného týždňa. Zo zálohy typu differential tiež nepostačuje pre obnovu do pôvodného stavu obnova iba tejto zálohy. V prípade havárie servera alebo diskového poľa je nutné najprv obnoviť poslednú zálohu typu full backup a neskôr v časovom slede poslednú zálohu typu Differential v období po poslednej zálohe typu Full backup. Z toho vyplýva, že diferenciálne (rozdielové) zálohy sú z pohľadu vytvorenia porovnateľne rýchle ako inkrementálne, čas obnovy je vďaka nutnosti obnoviť iba jedinú diferenciálnu zálohu kratší, pričom tu je zrejmá závislosť na tom, koľko nekompletných záloh od poslednej plnej zálohy prebehlo. Prvý deň po plnej zálohe je čas na zálohovanie u inkrementálného aj diferentálného typu zhodný, v priebehu ďalších dní narastá čas pre zálohovanie diferenciálnou metódou, čas na obnovu sa však relatívne skracuje.

Či teda ako doplnok plnej zálohy zvolíte metódu zálohovania inkrementálnu alebo diferenciálnu záleží len na prostredí Vašej spoločnosti. V týchto prípadoch je však lepšie si nechať urobiť analýzu a návrh politík od odborníkov, aby sa včas predišlo chybám v zle navrhnutej politike zálohovania, ktorá môže spoločnosti spôsobiť zlé vynaloženia prostriedkov do oblasti storage.

Po krátkom priblížení dostupných typov záloh sa môžeme pustiť do stručného popisu najpoužívanejších metód rotáciou pások s použitím vyššie uvedených typov záloh.

Rotácia pások

Round Robin (schéma s jednou páskou pre každý deň)
Najjednoduchšie schéma rotácie pások získame, keď vyhradíme pre každý deň pracovného týždňa jednu pásku. Pásky sú označené (pondelok, utorok, streda, štvrtok, piatok). Každý deň je vykonaná na danú pásku plná záloha všetkých dát vyhradených pre zálohovanie. Táto rotácia umožňuje obnovu dát s maximálnym posunom späť - jeden týždeň. Schéma je vhodné pre použitie v menších spoločnostiach s využitím internej alebo externej páskovej mechaniky  alebo s využitím zariadení NAS s vytvorenou VDL, (virtual disk library) ktorá môže slúžiť ako primárne úložisko dát. Toto riešenie je vhodné tiež tam, kde je možné vykonávať každý deň plnú zálohu, a časový posun o 1 týždeň späť je dostačujúci.

Grandfather-Father-Son (GFS)
Medzi najbežnejšie používané schémy zálohovania patrí metóda "Grandfather-Father-Son" Táto schéma využíva denné (Son), týždenné (Father) a mesačné (Grandfather) média sety. Štyri média sety sú označené pre každodennú zálohu v pracovnom týždni (napr. pondelok až štvrtok). Na tieto média sety (označené vo schéme GFS ako Son) potom prebiehajú inkrementálne zálohy. Tieto média sety (Son) sú opätovne prepisované v ďalšom týždni. Ďalšou skupinou obsahujúcou päť média setov, ktorá je obsiahnutá v zálohovacej schéme GFS sú média sety označené ako Week 1, Week 2, atď (Father). Viď obrázok: 

      

Na tieto média sety (Father) prebiehajú každý týždeň plné zálohy, média sety zo setu Son nie sú použité a pre skupinu "Father" je nastavená doba exspirácie jeden mesiac. Potom nasleduje ich opätovný prepis. Finálny média set "Grandfather" sa skladá z 3 média setov (média set môže byť tvorený ako jednou páskou tak i niekoľkými páskami) a je označený "Month 1, Month 2, Month 3, atď." Na tieto média sety potom prebieha opätovný zápis raz za tri mesiace a viac mesiacov (záleží koľko média setov je vyčlenených pre skupinu "Grandfather". U týchto média setov je nastavená exspirácia (t.j. možnosť ďalšieho prepisu) podľa počtu média setov v skupine Grandfather. Každý "médium set" zo skupiny pások (Son, Father  alebo Grandfather) je buď samostatná páska alebo skupina pások. Čo je závislé na veľkosti zálohovaných dát. Celkový počet použitých média setov v zálohovacej schéme GFS je dvanásť. Z dôvodov opotrebenia pások a z dôvodov zachovania dlhšej histórie (archivácia) záloh je doporučené média sety v danom časovom intervale meniť za nové.

Tower of Hanoi (Hanojská veža)
Schéma Hanojskej veže vychádza z logickej hry, ktoré má svoj pôvod v Číne. Hra je postavená na presunutí piatich kotúčov z jedného kolíka na niektorý ďalší, a to s minimálnym počtom ťahov. Pritom hráč nikdy nesmie mať v ruke viac ako jeden kotúč a nikdy nesmie dať väčší kotúč na menší. Je dokázané, že najmenší počet ťahov je 31.

Metóda Hanojské veže využíva pre zálohovanie päť média setov:
  • Média set A je použitý každý iný deň
  • Média set B je použitý každý štvrtý deň
  • Média set C je použitý každý ôsmy deň
  • Média sety D a E sú použité striedavo každý šestnásty deň
Naplánovanie schémy Tower of Hanoi je nasledovné:


Záloha začína na média set "A" a potom následne pokračuje v každý iný deň. Ďalšia záloha prebieha na média set "B" (nie však v deň kedy prebehla záloha na média set "A") a následne sa opakuje každú štvrtú zálohu. Média set "C" nezačína v deň zálohy média setov "A" a "B" a opakuje sa každú ôsmu zálohu. Pre médiá sety "D" a "E" je nastavená politika nasledovne. Prvá záloha nezačína v deň zálohy média setu "A", "B" alebo "C" a opakuje sa každú šestnástu zálohu.

Prednosťou tejto schémy je predovšetkým možnosť pridania nového média setu a tým získanie väčšej histórie zálohy (obdobne ako u GFS). Častejšie používané média sety obsahujú novšie kópie súborov, zatiaľ čo menej používané média sety obsahujú staršie verzie súborov.

Táto schéma je celkom ťažká na manuálne riadenie. Preto je pre túto schému doporučené používať zálohovací software s možnosťou Scheduling celého procesu (napr. NetVault 7.1) a hlavne za použitia páskového autoloaderu (napr. Tandberg, autoloader SLR140) alebo vhodnejšie riešenie s viacerými slotmi a to páskové knižnice (napr. ADIC Scalar 24, ADIC Scalar 100) pre dostatočný počet média setov zahŕňajúce pásky pre zálohovanie, archiváciu a disaster recovery riešenia. Rovnako ako schéma Grandfather-Father-Son umožňuje riešenie Tower of Hanoi periodické vybratie média setu za účelom archivácie.

 

Na záver

Súčasné trendy zálohovania prinášajú navyše do zálohovacích schém využitie primárnych a sekundárnych úložísk dát pre vyššiu bezpečnosť. Ako primárne úložisko dát vo väčšine spoločností slúži zariadenie NAS (Network Attached Storage) kam väčšinou prebiehajú zálohy v pracovnom týždni na disky a potom migrujú na páskové mechaniky či páskové knižnice.

Pri návrhu celého riešenia je dobré vychádzať z nižšie uvedených rovníc pre výpočet počtu potrebných pások umožňujúcich bezpečnú zálohu, archiváciu dát a riešenie Disaster recovery. O využitie primárnych úložísk postavených na zariadeniach NAS (napr. Iomega NAS p400/p800) a následne migráciu dát na sekundárne úložisko postavené na páskovej technológii s využitím zálohovacích schém si povieme niečo viac nabudúce.

Kalkulácia počtu pások pre zálohovanie vrátane archivácie a Disaster Recovery:

Pásky dedikované pre zálohy
Xs = D * T * S * R + N
Xs = počet pások potrebných pre zálohovanie na dobu jedného roka
D = počet zálohovacích mechaník
T = počet pások v média sete
S = počet média setov v zálohovacej schéme
R = počet rotácií zálohovacej schémy za rok

Pásky dedikované pre archiváciu
Xa = T * S * A
Xa = počet pások potrebných pre archiváciu
T = počet pások potrebných pre kópiu zálohy každého servera
S = počet serverov
A = počet archívnych setov za rok

Pásky dedikované pre Disaster Recovery
Xr = T * S * R
Xr = počet pások potrebných pre recovery
T = počet pások potrebných na Disaster Recovery zálohu jedného servera (viď archivácia)
S = počet serverov (viď archivácia)
R = počet požadovaných rotácií disaster recovery za rok

Celková ročná potreba dátových pások
X = Xs + Xa + Xr + R
X = celkový počet pások potrebných po dobu jedného roka
Xs = počet pások potrebných pre zálohovanie na dobu jedného roka
Xa = počet pások potrebných pre archiváciu
Xr = počet pások potrebných pre recovery
R = približný počet pások, ktoré bude treba nahradiť novými