1. Prehľad RAIDu
V roku 1988 navrhla Kalifornská univerzita v Berkeley koncept RAID (RedundantArrayofIncheapDisks) a keďže cena diskov naďalej klesala, RAID sa stal (RedundantArrayofIndependentDisks), ale obsah sa nezmenil. SNIA, Berkeley a ďalšie organizácie stanovili sedem úrovní RAID0~RAID6 ako štandardné RAID úrovne a štandardný RAID je možné kombinovať s inými úrovňami, pričom najpoužívanejšie úrovne sú RAID0, RAID1, RAID3, RAID5, RAID6 a RAID10. Každá úroveň RAID predstavuje implementačnú metódu a technológiu a medzi úrovňami nie je žiadny rozdiel. V praktických aplikáciách by sa mala vhodná úroveň RAID a konkrétne implementačné metódy vybrať na základe charakteristík používateľskej dátovej aplikácie, pričom sa zohľadňuje dostupnosť, výkon a náklady.
Z hľadiska implementácie sa RAID delí hlavne na tri typy: soft RAID, hard RAID a hybridný RAID. Všetky funkcie soft RAID vykonáva operačný systém a CPU, ktorý je prirodzene najmenej efektívny. Hard RAID je vybavený špecializovanými RAID riadiacimi/spracovateľskými čipmi a I/O procesormi a buffermi poľa, ktoré nezaberajú CPU zdroje, ale sú nákladné. Hybrid RAID má RAID riadiace/spracovateľské čipy, ale chýbajú mu I/O procesory, ktoré vyžadujú CPU a ovládače na dokončenie, a výkon a náklady sa pohybujú medzi soft a hard RAID.
2. Základné princípy
RAID je diskový subsystém pozostávajúci z viacerých nezávislých, vysoko výkonných diskových jednotiek, čím poskytuje vyšší výkon úložiska a technológiu dátovej redundancie než jeden disk. RAID je trieda technológií na správu viacerých diskov, ktorá poskytuje vysoko výkonné úložisko s vysokou spoľahlivosťou dát za prijateľné náklady pre hostiteľské prostredie. Dva kľúčové ciele RAID sú zlepšiť spoľahlivosť dát a výkon I/O. V diskovom poli sú dáta rozložené na viacerých diskoch, ale pre počítačový systém je to ako jeden disk. Redundancia sa dosahuje zápisom tých istých dát na viacero diskov naraz (typicky napríklad zrkadlením) alebo zápisom vypočítaných kontrolných dát do poľa, čím sa zabezpečuje, že strata dát nevznikne pri zlyhaní jedného disku.
V RAID existujú tri hlavné koncepty a techniky: zrkadlenie, DataStripping a Dataparity:
Zrkadlenie, ktoré replikuje dáta na viacero diskov, zvyšuje spoľahlivosť na jednej strane a zlepšuje výkon čítania tým, že číta dáta z dvoch alebo viacerých replík súčasne. Je zrejmé, že výkon zápisu obrazu je o niečo nižší a trvá dlhšie, kým sa zabezpečí správny zápis dát na viacero diskov. Data striping, ktorý drží dátové úlomky na viacerých rôznych diskoch a viaceré dátové úlomky spolu tvoria kompletnú kópiu dát, čo sa líši od viacerých kópií zrkadlenia, a často sa používa na účely výkonu. Dátové pásy majú vyššiu granularitu súbežnosti a pri prístupe k dátam môžu čítať a zapisovať údaje na rôznych diskoch súčasne, čo vedie k výraznému zlepšeniu výkonu I/O. Overovanie dát, využívajúce redundantné dáta na detekciu a opravu chýb údajov, redundantné dáta sa zvyčajne počítajú pomocou Hemingwayovho kódu, prevádzky XOR a ďalších algoritmov. Funkcia overovania môže výrazne zlepšiť spoľahlivosť, odcudzenie a odolnosť voči chybám diskových polí. Avšak validácia dát vyžaduje, aby boli údaje čítané z viacerých zdrojov, vypočítané a porovnávané, čo môže ovplyvniť výkon systému. Rôzne triedy RAID využívajú jednu alebo viac z troch technológií na dosiahnutie rôznej spoľahlivosti dát, dostupnosti a výkonu I/O. Čo sa týka toho, ktorý RAID navrhnúť (alebo dokonca nový stupeň či typ), alebo aký režim RAID použiť, je potrebné urobiť rozumné rozhodnutie na základe hlbokého pochopenia potrieb systému a komplexne vyhodnotiť spoľahlivosť, výkon a náklady na kompromis.
Všeobecne platí, že hlavné výhody RAID sú: veľká kapacita, vysoký výkon, spoľahlivosť a spravovateľnosť.
3. Hodnotenie RAID
JBOD (JustaBunchOfDisks) nie je štandardná RAID úroveň, často sa používa na reprezentáciu kolekcie diskov, ktoré nemajú riadiaci softvér na koordinovanú kontrolu. JBOD spája viacero fyzických diskov v sérii, čím vytvára obrovský logický disk. Výkon úložiska je presne rovnaký ako na jednom disku a neposkytuje bezpečnosť dát. Dostupná kapacita úložiska sa rovná súčtu úložného priestoru všetkých členských diskov.
RAID0, nazývaný pruhovanie, je jednoduchá, nekontrolovaná technológia pruhovania dát. Výkon je najvyšší zo všetkých RAID úrovní. Nie sú poskytované žiadne politiky odstupného. 100 % využitie úložného priestoru.
RAID1 sa nazýva zrkadlenie a zapisuje dáta na pracovný disk aj zrkadlený disk úplne konzistentne, pričom má využitie miesta na disku 50 %. Výkon je ovplyvnený, keď sa zapisujú dáta, ale údaje sa nečítajú. Poskytuje najlepšiu ochranu dát, keď funkčný disk zlyhá, systém automaticky načíta dáta z zrkadleného disku, čo neovplyvní prácu používateľa.
RAID2 sa nazýva Heming Code Disk Array a jeho návrhová myšlienka spočíva v použití Hemingovho kódu na dosiahnutie redundancie overovania dát. Čím väčšia dátová šírka, tým vyššie využitie úložného priestoru, ale tým viac diskov potrebujete. Má schopnosť opravovať chyby, ale režijná záťaž Hemingcode na redundanciu dát je príliš veľká a rekonštrukcia dát je veľmi časovo náročná, preto sa RAID2 v praxi používa len zriedka.
RAID3 sa nazýva dedikovaný paritný pásik, ktorý používa dedikovaný disk ako kontrolný disk a zvyšok diskov ako dátový disk, pričom dáta sú uložené krížovo uložené na každom dátovom disku v bitoch a bajtoch. RAID3 vyžaduje aspoň tri disky.
RAID4 a RAID3 fungujú na podobnom princípe. Poskytuje veľmi dobrý výkon čítania, ale slabý výkon zápisu. A s rastúcim počtom členových diskov sa systémové úzke hrdlo kontrolného súčtu stáva výraznejším. V reálnych aplikáciách je zriedkavý a bežné úložné produkty zriedka používajú ochranu RAID4.
RAID5 sa nazýva distribuovaný paritný kontrolný pás, ktorý by mal byť v súčasnosti najbežnejšou úrovňou RAID, a princíp je podobný ako v RAID4, no počas súbežných zápisových operácií v RAID4 nedochádza k obmedzeniu výkonu kontrolného disku.
RAID6, nazývaný double parity strip, zavádza koncept dvojitých kontrol na vyriešenie problému integrity dát, keď zlyhajú dve disky súčasne, čo iné triedy RAID nedokážu vyriešiť. Avšak stojí oveľa viac ako RAID5, má slabý výkon zápisu a je veľmi zložitý na návrh a implementáciu. Preto sa RAID6 v praxi zriedka používa a vo všeobecnosti predstavuje ekonomickú alternatívu k riešeniam RAID10.
Štandardné RAID úrovne majú svoje silné aj slabé stránky. Kombinovať viaceré úrovne RAID, aby ste dosiahli komplementárne výhody a kompenzovali navzájom svoje nedostatky, aby sa dosiahol RAID systém s vyšším výkonom, bezpečnosťou dát a ďalšími ukazovateľmi. Samozrejme, náklady na implementáciu kombinovanej úrovne sú zvyčajne veľmi vysoké a používajú sa len v niekoľkých špecifických prípadoch. V skutočnosti sa široko používajú len RAID01 a RAID10.
RAID01 sa najprv pruhuje a potom zrkadlí, čo v podstate slúži na zobrazenie fyzického disku; RAID10 je najprv obraz a potom stripe, čo znamená obraz virtuálneho disku. Pri rovnakej konfigurácii má RAID01 zvyčajne lepšiu odolnosť voči chybám ako RAID10. RAID01 kombinuje výhody RAID0 a RAID1, pričom celkové využitie disku je len 50 %.
4. Porovnanie hlavných úrovní RAID
RAID konfigurácia
Úroveň/Popis: | Chybám | zásluha | nedostatok | RAID 0
Mapujte dáta naprieč diskami, aby ste vytvorili veľké virtuálne disky. Keďže každý fyzický disk spracováva len časť požiadavky, môže poskytovať vyšší výkon. Ak však jeden disk zlyhá, virtuálny disk (VD) sa stane neprístupným a dáta sa natrvalo stratia. | nie | Lepší výkon Dodatočné úložisko | Nesmie sa používať pre kritické dáta | RAID 1
Zrkadliť dáta, uložiť dátovú redundanciu na dva disky. Ak jeden disk zlyhá, druhý disk prevezme úlohu primárnej jednotky. | Chyba disku Porucha jedného disku | Vysoký výkon čítania Rýchle zotavenie po poruche disku Redundancia dát | Režijné náklady na disk sú veľké Obmedzená kapacita | RAID 5
Mapujte dáta na disky a ukladajte paritné bity každého dátového pásu na rôzne disky vo VD. Paritný bit obsahuje informácie, ktoré možno použiť na rekonštrukciu dát z nefunkčného disku z iného disku v prípade jedného zlyhania disku. | Chyba disku Porucha jedného disku | Efektívne využitie kapacity pohonu Vysoký výkon čítania Stredný až vysoký výkon zápisu | Mierny vplyv na poruchu disku Vďaka prepočítaniu parity je čas rekonštrukcie dlhší | RAID 6
Mapujte dáta na disky a ukladajte paritné bity každého dátového pásu na rôzne disky vo VD. Na rozdiel od RAID 5 RAID 6 vykonáva dva výpočty parity (P a Q), čo mu umožňuje odolávať poruchám dvoch diskov. | Redundancia dát Vysoký výkon čítania | Chyba disku Zlyhanie dvoch diskov | Výkon zápisu je znížený kvôli dvom výpočtom parity Keďže je to ekvivalentné použitiu 2 diskov pre paritu, existuje dodatočná cena | RAID 10
Pásiky na zrkadlovej sade. Režijné náklady na disk sú vysoké, ale je to skvelé riešenie pre vysoký výkon, redundanciu a rýchle zotavenie v prípade poruchy disku. | Chyba disku Jedna porucha disku na sadu obrazov | Vysoký výkon čítania RAID skupiny s až 192 diskami môžu byť podporované | Najvyššia cena | RAID 50
RAID 5 strip na pľaci. Znížením počtu čítaní na disku na výpočet parity je možné zlepšiť výkon s RAID 5 v závislosti od konfigurácie. | Chyba disku Jedno zlyhanie disku na každý rozsah | Vysoký výkon čítania Stredný až vysoký výkon zápisu RAID skupiny s až 192 diskami môžu byť podporované | Mierny vplyv na poruchu disku Vďaka prepočítaniu parity je čas rekonštrukcie dlhší | RAID 60
RAID 6 strip na pľaci. Pri menšom počte čítaní z disku na výpočet parity je možné zlepšiť výkon s RAID 6 v závislosti od konfigurácie. | Chyba disku Dva disky zlyhajú na jeden rozsah | Vysoký výkon čítania RAID skupiny s až 192 diskami môžu byť podporované | Výkon zápisu je znížený kvôli dvom výpočtom parity Keďže je to ekvivalentné použitiu 2 diskov pre paritu, existuje dodatočná cena |
5. Rozdiel v softvéri a hardvéri RAID
Soft RAID
Soft RAID nemá samostatný riadiaci čip ani I/O čip, a operačný systém a CPU implementujú všetky RAID funkcie. Moderné operačné systémy v podstate ponúkajú podporu soft RAID, poskytujúc abstrakciu medzi fyzickými a logickými diskami pridaním softvérovej vrstvy nad ovládačmi diskových zariadení. V súčasnosti sú najbežnejšie RAID hodnotenia podporované operačným systémom RAID0, RAID1, RAID10, RAID01 a RAID5. Napríklad Windows Server podporuje RAID0, RAID1 a RAID5, Linux podporuje RAID0, RAID1, RAID4, RAID5, RAID6 a ďalšie, a Mac OS X Server, FreeBSD, NetBSD, OpenBSD, Solaris a ďalšie operačné systémy tiež podporujú zodpovedajúce RAID úrovne.
Správa konfigurácie a obnova dát v soft RAID sú relatívne jednoduché, ale všetky RAID úlohy sú úplne dokončené CPU, napríklad výpočet kontrolných hodnôt, takže efektivita vykonávania je relatívne nízka.
Soft RAID je implementovaný operačným systémom, takže partícia, kde sa systém nachádza, nemôže byť použitá ako logický členský disk RAID, a soft RAID nemôže chrániť systémový disk D. Pre niektoré operačné systémy sú konfiguračné informácie RAID uložené v systémových informáciách, nie ako samostatný súbor na disku. Týmto spôsobom, keď systém neočakávane spadne a bude potrebné ho preinštalovať, informácie o RAID sa stratia. Okrem toho technológia odolnosti voči chybám disku plne nepodporuje online výmenu, hot swapping alebo hot swapping, a či dokáže podporiť hot swap nesprávneho disku, závisí od implementácie operačného systému.
Hard RAID
Hard RAID má vlastné RAID riadiace procesory a I/O procesory, a dokonca aj array buffering, ktorý je najlepší z troch typov implementácií z hľadiska využitia CPU a celkového výkonu, ale zároveň má najvyššie náklady na implementáciu. Hard RAID zvyčajne podporuje technológiu hot-swapping, ktorá nahrádza poškodené disky počas bežiaceho systému.
Hard RAID pozostáva z RAID karty a RAID čipu integrovaných na základnej doske, pričom serverové platformy často používajú RAID karty. RAID karta pozostáva zo 4 častí: RAID jadrového procesora (CPU na RAID karte), portu, cache a batérie. Medzi nimi porty označujú typy diskových rozhraní podporovaných RAID kartami, ako sú IDE/ATA, SCSI, SATA, SAS, FC a ďalšie rozhrania.
Zmiešaný tvrdý a mäkký RAID
Soft RAID nie je veľmi dobrý a nechráni systémové partície, čo sťažuje jeho aplikáciu na desktopové systémy. Hard RAID je veľmi drahý a rôzne RADy sú nezávislé a nie sú interoperabilné. Preto ľudia používajú kombináciu softvéru a hardvéru na implementáciu RAID, aby dosiahli kompromis medzi výkonom a nákladmi, teda vysoký výkon.
Hoci tento RAID používa procesorový riadiaci čip, kvôli úspore nákladov je často lacnejší a má slabší výpočtový výkon, pričom väčšinu úloh RAID stále vykonáva CPU prostredníctvom ovládačov firmvéru.
6. Výber žiadosti RAID
Pri výbere RAID úrovne sú tri hlavné faktory: dostupnosť dát, výkon I/O a náklady. Ak dostupnosť nie je potrebná, vyberte RAID0 pre vysoký výkon. Ak sú dostupnosť a výkon dôležité a cena nie je hlavným faktorom, vyberte RAID1 podľa počtu diskov. Ak sú dostupnosť, cena a výkon rovnako dôležité, vyberte RAID3 alebo RAID5 na základe všeobecného prenosu dát a počtu diskov. V praktických aplikáciách by sa vhodná úroveň RAID mala vybrať na základe charakteristík a špecifických podmienok používateľskej dátovej aplikácie, pričom sa zohľadňuje dostupnosť, výkon a náklady.
|