Odborná sekcia
JAK VYBRAT DISKOVÉ POLE – 4. díl
13.11.2015, 14:06
Milí naši čtenáři, předně děkujeme za Váš stoupající zájem, který je pro nás podnětem v pokračování bezpochyby úspěšného seriálu Jak vybrat diskové pole.
Jelikož ani obor IT není ušetřen marketérů celé řady výrobců, kteří soutěží ve vynalézavosti s cílem „kreativním“ způsobem zamaskovat objektivně vzato špatné provozní vlastnosti diskového pole, další díl naší úspěšné série věnujeme problematice „Storage Performance“.
Neopominutelným faktem je, že i drobná změna v nastavení parametrů stress testu diskového pole může přivodit rozdíl ve změřených výkonnostech v řádu desítek i stonásobků.
JAK ZMĚŘIT VÝKONNOST DISKOVÉHO POLE?
Lze tak učinit použitím některého z testovacích programů, které vytvářejí syntetickou zátěž diskového pole. Na výběr je slušná řada – například IOzone, IOmeter, SQLIO a ti, kdo se pohybují v oboru „video entertainment“, budou znát unikátní projekt FIO umožňující generovat zátěž typickou pro HD-recording aplikace.
Společným znakem všech programů však zůstává, že pro test je třeba nadefinovat parametry workloadu. A těch může být celá řada. Čtení či zápis, sekvenční či náhodné operace, velikosti bloků, počet konkurenčních streamů a mnoho dalšího. Jak jsem v úvodu předeslal, i drobné změny parametrů mohou mít naprosto rozdílné dopady do algoritmů diskového pole a změřené výsledky se mohou diametrálně měnit.
Co z toho plyne? Samotná informace, že diskové pole dokázalo vypořádat například 50 000 Input/Output operací za sekundu, nevypovídá vůbec o ničem. Za určitých podmínek testu si s touto zátěží poradí low-end z Tchaj-wanu (při vší úctě, vyrábí se zde řada dobrých řešení), při jiných parametrech testu budou mít s tímto požadavkem potíže i Hi-End modely řady výrobců zvučných jmen (a to si ještě budou muset vypomoci SSD disky).
Cestou, jak vnést řád do srovnání diskových polí, je standardizace podmínek testů. Chvályhodným počinem je konání organizace Storage Performance Council, která vytvořila takzvané SPC standardy na testování diskových polí.
STORAGE PERFORMANCE COUNCIL
Stránky této organizace naleznete na www.storageperformance.org. Zde probíhá jednotné a férové testování výkonnosti diskových systémů.
Důvěryhodnost a duch fair play programu SPC je naplněn faktem, že naměřené výsledky musí být akceptovány všemi členy SPC rady, což jsou skoro všichni výrobci diskových systémů. Výsledkem každého SPC testování je elaborát shrnující základní fakta o tom, jaká konfigurace se testovala a jakých výsledků se dosáhlo.
Testy jsou standardizovány a každému se tak měří stejným metrem. Test SPC-1 se zaměřuje na transakční rychlosti, tedy IOPs. Test SPC-2 se zaměřuje na přenosovou rychlost, neboli propustnost diskových systémů, tedy MB/s.
V běžných aplikacích datového centra a také díky serverové virtualizaci jednoznačně převládají náhodné operace, a proto má smysl se zaobírat zejména SPC-1 testy. Nechť kolegové z oboru video entertainment prominou, SPC-2 testy se budeme zabývat někdy příště.
JAK TEDY SPC-1 TEST FUNGUJE?
Princip testu je založen na simulaci typického provozu v data centrech – tedy napodobení provozu databázových systémů, uživatelských dat a logování. Tyto tři provozy jsou realizovány pomocí takzvaných „ASU Workers“, což není nic jiného než generátor zátěže daných parametrů. Každý z ASU Wolkerů pracuje s určitým počtem konkurenčních streamů tak, aby výslednice všech těchto zátěží co nejlépe korespondovala s realitou datového centra.
Na výše uvedených webových stránkách lze nalézt performance testy pro řadu výrobců. Jednotná metodologie testování omezila možnost výrobců postavit si podmínky testu „na míru“ tak, aby dosáhly oslňujících, ale v praxi nereálných výsledků.
Prostor výrobců pro „marketingové triky“ byl díky SPC testům značně zúžen, ale několik trumfů v rukávu zůstalo. Je to dáno tím, že SPC testy vznikly před nástupem řady nových technologií a ne zcela reflektují jejich specifické vlastnosti.
Například nástup storage systémů postavených na Intel architektuře a embedovaném Linux/Unix operačním systému, pro které je typický exponenciální růst vnitřní režie při kapacitním zaplnění typicky nad 60 %. Nebo třeba nestabilita výkonnosti SSD způsobená jejich složitými algoritmy zapisování. V takových případech je snahou výrobce omezit délku testu či netestovat na celé dostupné kapacitě tak, aby parametry produktu vyzněly v lepším světle. Nicméně o těchto tricích až příště a zpět k posouzení výkonnosti diskového pole.
O ČEM SPC-1 TEST VYPOVÍDÁ?
Výsledky SPC testů vypovídají o výkonnostním potenciálu daného diskového pole. Ovšem za jednoho důležitého předpokladu – a to dostatečném počtu disků. Proto konfigurace diskových systémů v SPC testech bývají blízko maxima možného počtu disků. Poněkud zjednodušeně řečeno – výkonnost celku je dána výkonem manažerů (controllerů) a dále počtem a výkonností dělníků (disků).
V praxi však bývají počty disků na zlomku maxima daného diskového pole. Výkonnostní potenciál controllerů je pak limitován výkonností diskových zdrojů. Klíčem ke stanovení výkonnostního potenciálu je pak posouzení všech aspektů.
NEJDE JEN O KVANTITU!
Výsledkem SPC testů je rozsáhlý elaborát, který kromě kvantitativního hlediska (kolik IOPs diskové pole dosáhlo) řeší i další a často opomíjené hledisko. Tím je kvalita služby, aneb při jakých response time byl tento výkon dosažen. Výkonnost aplikací, databází a podobně nezáleží totiž jen na tom, jakého maxima IOPs je schopné diskové pole dosáhnout, ale zejména s jakým reakčním časem je schopno tyto IO operace obsloužit.
A zde se začínají mnozí výrobci lišit. Zejména systémy, které jsou vnitřně komplikované, například výše zmíněná softwarově definovaná disková pole, na sebe prozradí skutečnost, že response time při zátěži extrémně stoupá následkem vysoké vnitřní režie.
V praxi panuje úzus, že použitelné latence diskového pole jsou do 5 ms. Vše nad má dopad do aplikací. Proto je dobré při posouzení výsledků SPC testu zohlednit nejen dosažené množství IOPs, ale zejména počet IO operací obsloužených do 5 ms. Mnohé SPC benchmarky by pak vyzněly v poněkud jiném světle, protože reálný výkon, při kterém jsou latence ještě únosné, by byl podstatně menší.
Podívejme se na příklad SPC benchmarku pro diskový systém Hitachi HUS-VM. Jde o testování konfigurace s „točivými“ disky.
Graf ukazuje, že systém byl schopen obsloužit cca 181 000 IOPs a všechny tyto operace byly obslouženy hluboce pod hranicí 5 ms. Takovýto diskový systém se bude v datovém centru chovat korektně a předvídatelně. Mimochodem, full-flash konfigurace HUS-VM dosáhla výkonnosti 300 000 IOPs, přičemž 100 % operací bylo obslouženo pod 1 ms, což je výsledek kterého běžně výrobci full-flash systémů zdaleka nedosahují.
V příštím díle se pokusíme odpovědět na zdánlivě jednoduchou otázku – Je výkonnější RAID 5nebo RAID 10?
Těšíme se na Vaše podněty.