Zavřít
Vstoupit Následujte nás

3S.cz

Odborná sekce

JAK VYBRAT DISKOVÉ POLE – 1. díl

22.09.2015, 10:13

Mimořádný ohlas na články publikované v našem časopise ENTERPRISE na téma samotného výběru diskových polí nás velmi těší a děkujeme za ně. A protože naši čtenáři a klienti jsou naší inspirací, přinášíme nyní tento populární seriál v on-line dostupné verzi.

Není tomu tak dávno, kdy společnosti pro fungování svého IT potřebovaly řádově jednotky TB. Datové objemy však rostou exponenciálně a v současnosti se setkáváme s typickými firemními potřebami v řádu desítek až stovek TB.

Z hlediska investice představuje uložení takového objemu dat jednu z nejvyšších investic. A právem – zatímco veškerou ostatní infrastrukturu lze celkem „bezbolestně“ nahradit, tak sázka na špatného koně na poli diskových úložišť může mít vážné dopady. Počínaje finančními dopady z důvodu neflexibility zvoleného řešení po přímé finanční ztráty v podobě nedostupnosti či přímo ztráty dat.

Jak tedy úložiště dat vybrat a nepřebrat?

Klíčem k dobrému rozhodnutí je porozumění podstatě technologií a posouzení důležitých parametrů.

 

AUTOMATICKÝ TIERING

Předně je třeba zvážit, s jakým objemem dat se bude pracovat. Čím větší objem dat, tím složitější úkol musí společnosti řešit. Jde o to sladit dva protichůdné požadavky – tj. ukládat čím dál větší množství dat a zároveň k nim zajistit přístup v co nejkratších časech.

V souvislosti s tím se nabízí otázka: Jaký reakční čas diskového úložiště je ještě dobrý a od kdy je to již špatně? Nelze dát jednoznačnou radu, vždy záleží na konkrétní situaci a požadavcích businessu. Nicméně jako akceptovatelná se ustálila hranice do 5 ms, v případě databází je na místě požadavek ještě zpřísnit – do 3 ms.

Ale zpět k našemu problému. Řekněme, že společnost stojí před úkolem zajistit ukládání 50 TB o výkonnosti 50 000 Input/Output operací za sekundu, neboli 50 000 IOPs. Na vyřešení takovéhoto požadavku konvenční cestou bude třeba kromě adekvátně výkonného diskového pole také dostatečný počet disků, které budou schopny takový objem transakcí „vstřebat“. V tomto konkrétním případě by úkol řešilo až cca 200 ks 10 krmp disků, a to již vede k velkému úložišti a nemalé investici.

Problém má však i jiné řešení. Statisticky totiž firmy pracují jen s malou částí dat – většinou těch nejmladších. Ostatní data mají povahu spících dat. Čím starší, tím méně se s nimi pracuje. Jednoduchá úvaha tedy napovídá, že by bylo dobré data, se kterými se pracuje často, ukládat na rychlých discích a naopak „spící“ data na NL-SAS discích. Tato myšlenka se jmenuje automatický tiering a znamená, že diskové pole pracuje s různými typy disků (… s různou výkonností a cenou za GB) a dovede nalézt optimální místo uložení.

Velmi výmluvný je výzkum společnosti Gartner, který dospěl k závěru, že spojení automatického tieringu a SSD vrstvy o kapacitě pouhých 3 % celkové instalované kapacity obslouží až 80 % Input/Output požadavků generovaných infrastrukturou. Zmíněná 3 % je třeba brát jako minimální doporučení – i v souvislosti s cenovým pádem SSD technologií je optimální se pohybovat na cca 5 % – 10 %.

Doporučení společnosti Gartner pro procentuální rozložení kapacitních poměrů výkonnostních a kapacitních tierů pro výkonnostně orientované systémy.

 

A tady začíná také první úskalí. Mnoho výrobců tvrdí, že jejich diskové pole obsahuje tiering, jenže ono jich existuje několik druhů a vzájemně se liší efektivitou:

-       LUN Tiering – Nejstarší a nejjednodušší. Neumí víc, než celý LUN přesouvat mezi výkonností a kapacitní oblastí.

-       SSD Cache – Vlastně se ani nejedná o tiering, pouze o využití SSD disku jako cache diskového pole. Nejčastěji používaná data jsou načtena na SSD médium. Jedná se o jednoduché řešení, které není programátorsky náročné a dokáže akcelerovat Input/Output operace.

-    Sub-LUN Tiering – Ten nejpokročilejší způsob. Dokáže přesouvat stránky dat i v rámci Logického disku (LUNu) mezi různými tiery diskového pole. Automaticky rozpozná podle četnosti přístupů, se kterými stránkami se pracuje často a ty přemisťuje do rychlých disků (např. SSD či SAS RAID10). A naopak stránky, se kterými se pracuje sporadicky, přemísťuje do oblastí s menší cenou za GB.

Zastavme se u Sun-Lun Tieringu. Ten u žádného výrobce neumí přesouvat jednotlivé bajty, ale z důvodů vnitřní režie pracuje s bloky dat – tzv. „page“. A v tom se výrobci liší a panuje zde řada mýtů. Ten největší mýtus je, že menší page znamená větší granularitu a tím lepší efektivitu tieringu. Pravdou je, že velikost přesouvaných page v rámci tieringu výrobce volí podle možností architektury diskového systému. A tak se na jedné straně setkáváme s velikostí page 1 GB (a to je opravdu mnoho) a na druhé straně s velikostí 512 kB. Například Enterprise diskové pole HUS-VM společnosti Hitachi může díky silnému enterprise kontroléru a velikosti cache používat vetší velikost bloku, konktrétně 42 MB. Používání rozumně velkých bloků v případě Tieringu je žádoucí, protože minimalizuje interní režii (ztrátu výkonnosti) těchto funkcí. Požívání větších bloků však vyžaduje výkonný kontrolér s vysokou propustností GB/s a cache, aby tyto bloky dat mohl zpracovat bez dopadů do obsluhy serverů. Některé konkurenční systémy jsou limitovány malou výkonností a musí proto používat malé bloky např. 512 kB, které prudce zvyšují režii tieringu, prodlužují response time a zásadně degradují celkovou výkonnost diskového systému.

 

V příštím díle se budeme věnovat tématu Architektury diskových polí.


Následující díl >>