Ten artykuł jest lustrzanym artykułem tłumaczenia maszynowego, kliknij tutaj, aby przejść do oryginalnego artykułu.

Widok: 11848|Odpowiedź: 1

Wyjaśnienie technologii RAID - porównanie RAID0, RAID1, RAID3, RAID5, RAID6, RAID10

[Skopiuj link]
Opublikowano 2021-10-3 20:57:56 | | | |
1. Przegląd RAID

W 1988 roku Uniwersytet Kalifornijski w Berkeley zaproponował koncepcję RAID (RedundantArrayofIncheapDisks), a wraz ze spadkiem kosztów dysków RAID stał się (RedundantArrayofIndependentDisks), ale jego treść się nie zmieniła. SNIA, Berkeley i inne organizacje ustaliły siedem poziomów RAID0~RAID6 jako standardowe poziomy RAID, a standardowy RAID można łączyć z innymi poziomami RAID, a najczęściej używane poziomy to RAID0, RAID1, RAID3, RAID5, RAID6 i RAID10. Każdy poziom RAID reprezentuje metodę i technologię implementacyjną, nie ma rozróżnienia między poziomami. W praktycznych zastosowaniach odpowiedni poziom RAID oraz konkretne metody implementacji powinny być wybierane na podstawie cech aplikacji danych użytkownika, biorąc pod uwagę dostępność, wydajność i koszty.

Z punktu widzenia implementacji RAID dzieli się głównie na trzy typy: soft RAID, hard RAID oraz hybrid RAID. Wszystkie funkcje soft RAID wykonuje system operacyjny i procesor, który naturalnie jest najmniej wydajny. Hard RAID jest wyposażony w specjalistyczne układy sterujące/przetwarzające RAID oraz układy przetwarzania I/O i macierzy, które nie zużywają zasobów CPU, ale są kosztowne. Hybrid RAID ma układy sterujące/przetwarzające RAID, ale brakuje mu procesorów I/O, które wymagają procesora i sterowników do ukończenia, a wydajność i koszt wahają się między miękkim a twardym RAID.

2. Podstawowe zasady

RAID to podsystem dyskowy składający się z wielu niezależnych, wysokowydajnych napędów dyskowych, zapewniających tym samym wyższą wydajność pamięci oraz technologię redundancji danych niż pojedynczy dysk. RAID to klasa technologii zarządzania wieloma dyskami, która zapewnia wysokowydajne przechowywanie danych o wysokiej niezawodności danych w przystępnej cenie dla środowiska hosta. Dwa kluczowe cele RAID to poprawa niezawodności danych oraz wydajności I/O. W tablicy dysków dane są rozproszone na wielu dyskach, ale dla systemu komputerowego jest to jak pojedynczy dysk. Redundancję osiąga się poprzez zapis tych samych danych na wielu dyskach jednocześnie (zazwyczaj jak mirroring) lub przez zapisanie obliczonych danych kontrolnych do tablicy, co zapewnia uniknięcie utraty danych w przypadku awarii jednego dysku.

W RAID wyróżnia się trzy główne koncepcje i techniki: mirroring, DataStripping oraz parytet danych:

Lustrzane odbicia, które replikuje dane na wiele dysków, poprawia niezawodność z jednej strony i poprawia wydajność odczytu poprzez jednoczesny odczyt danych z dwóch lub więcej replik. Oczywiście wydajność zapisu obrazu jest nieco niższa i potrzeba więcej czasu, aby upewnić się, że dane są poprawnie zapisane na wielu dyskach.
Pasowanie danych, czyli przechowywanie fragmentów danych na wielu różnych dyskach, oraz wiele fragmentów danych razem tworzy pełną kopię danych, co różni się od wielokrotnych kopii mirroringu i często jest wykorzystywane ze względów wydajności. Paski danych mają wyższą szczegółowość współbieżności, a gdy dane są dostępne, mogą one jednocześnie odczytywać i zapisywać dane na różnych dyskach, co skutkuje znaczącą poprawą wydajności wejścia i wyjścia.
Weryfikacja danych, wykorzystując dane redundantne do wykrywania i naprawy błędów danych, dane redundantne są zwykle obliczane za pomocą kodu Hemingwaya, operacji XOR i innych algorytmów. Funkcja weryfikacji może znacznie poprawić niezawodność, kradzieży i odporność na awarie macierzy dyskowych. Jednak walidacja danych wymaga odczytu danych z wielu źródeł, ich obliczenia i porównania, co może wpływać na wydajność systemu.
Różne klasy RAID wykorzystują jedną lub więcej z tych trzech technologii, aby osiągnąć różną niezawodność, dostępność i wydajność I/O. Jeśli chodzi o projektowanie RAID (a nawet nowy gatunek czy typ) czy wybór typu RAID, konieczne jest podjęcie rozsądnego wyboru na podstawie dogłębnego zrozumienia potrzeb systemu oraz kompleksowa ocena niezawodności, wydajności i kosztów, aby podjąć kompromis.

Ogólnie rzecz biorąc, główne zalety RAID to: duża pojemność, wysoka wydajność, niezawodność i łatwość zarządzania.

3. Ocena RAID

JBOD (JustaBunchOfDisks) nie jest standardową warstwą RAID, często jest używana do reprezentowania zbioru dysków, które nie posiadają oprogramowania sterującego zapewniającego skoordynowane sterowanie. JBOD łączy wiele fizycznych dysków szeregowo, tworząc ogromny dysk logiczny. Wydajność pamięci jest dokładnie taka sama jak na pojedynczym dysku i nie zapewnia bezpieczeństwa danych. Dostępna pojemność pamięci jest równa sumie przestrzeni pamięci wszystkich dysków członkowskich.

RAID0, zwany stripingiem, to prosta, niekontrolowana technologia paskowania danych. Wydajność jest najwyższa spośród wszystkich poziomów RAID. Nie są zapewnione żadne polityki dotyczące redundancji. 100% wykorzystania przestrzeni magazynowej.

RAID1 nazywa się mirroringiem i zapisuje dane na działającym i lustrzanym dysku w pełnej kondycji, a jego wykorzystanie miejsca na dysku wynosi 50%. Wydajność jest obniżona podczas zapisu danych, ale nie są odczytywane. Zapewnia najlepszą ochronę danych, gdy działający dysk ulegnie awarii, system automatycznie odczytuje dane z lustrzanego odbicia, co nie wpływa na pracę użytkownika.

RAID2 nazywa się Heming Code Disk Array, a jego koncepcją jest wykorzystanie kodu Heminga do osiągnięcia redundancji weryfikacji danych. Im większa szerokość danych, tym większe wykorzystanie przestrzeni dyskowej, ale tym więcej dysków potrzebujesz. Ma możliwość korekcji błędów, ale narzut nadmianowości danych Hemingcode jest zbyt duży, a rekonstrukcja danych bardzo czasochłonna, dlatego RAID2 rzadko jest stosowany w praktyce.

RAID3 nazywany jest dedykowanym paskiem parzystości, który wykorzystuje dedykowany dysk jako dysk kontrolny, a pozostałe dyski jako dysk danych, a dane są przechowywane krzyżowo na każdym dysku w bitach i bajtach. RAID3 wymaga co najmniej trzech dysków.

RAID4 i RAID3 działają na podobnej zasadzie. Zapewnia bardzo dobrą wydajność odczytu, ale słabą wydajność zapisu. Wraz ze wzrostem liczby dysków członkowskich, wąskie gardło systemu dysku sumy kontrolnej stanie się bardziej widoczne. Jest rzadki w zastosowaniach rzeczywistych, a powszechne produkty pamięci masowej rzadko stosują ochronę RAID4.

RAID5 nazywany jest rozproszonym paskiem sumy kontrolnej parzystości, który obecnie powinien być najczęściej stosowanym poziomem RAID, a zasada jest podobna do tej w RAID4, jednak nie ma wąskiego gardła w wydajności dysku kontrolnego podczas jednoczesnego zapisu w RAID4.

RAID6, zwany paskiem podwójnej parzystości, wprowadza koncepcję podwójnych kontroli, aby rozwiązać problem integralności danych, gdy dwa dyski ulegają awarii jednocześnie, czego inne klasy RAID nie potrafią rozwiązać. Jednak kosztuje znacznie więcej niż RAID5, ma słabą wydajność zapisu i jest bardzo skomplikowany w projektowaniu i implementacji. Dlatego RAID6 rzadko jest stosowany w praktyce i generalnie stanowi ekonomiczną alternatywę dla rozwiązań RAID10.

Standardowe poziomy RAID mają swoje mocne i słabe strony. Łącz wiele poziomów RAID, aby osiągnąć komplementarne zalety i zrekompensować wzajemne niedociągnięcia, aby uzyskać system RAID o wyższej wydajności, bezpieczeństwie danych i innych wskaźnikach. Oczywiście koszt implementacji poziomu kombinacji jest zazwyczaj bardzo wysoki i stosowany tylko w kilku konkretnych przypadkach. W rzeczywistości powszechnie używane są tylko RAID01 i RAID10.

RAID01 jest najpierw paskowana, a następnie lustrzana, co zasadniczo służy do obrazu fizycznego dysku; RAID10 to najpierw obrazowanie, a potem stripe, czyli obrazowanie wirtualnego dysku. W tej samej konfiguracji RAID01 zazwyczaj ma lepszą odporność na awarie niż RAID10. RAID01 łączy zalety RAID0 i RAID1, z całkowitym wykorzystaniem dysku na poziomie zaledwie 50%.


4. Porównanie poziomów RAID w głównym nurcie



Konfiguracja RAID

Poziom/Opis:
Odporność na błędy
zasługa
niedociągnięcie
RAID 0

Mapuj dane na dyskach, aby tworzyć duże dyski wirtualne. Ponieważ każda fizyczna płyta przetwarza tylko część żądania, może zapewnić wyższą wydajność. Jednak jeśli jeden dysk ulegnie awarii, dysk wirtualny (VD) stanie się niedostępny, a dane zostaną trwale utracone.
nie
Lepsza wydajność
Dodatkowe miejsce przechowywania
Nie wolno go używać do danych krytycznych
RAID 1

Lustrzane odbicie danych, zapisz redundancję danych na dwóch dyskach. Jeśli jeden dysk ulegnie awarii, drugi dysk przejmuje rolę napędu głównego.
Błąd dysku
Awaria pojedynczego dysku
Wysoka wydajność odczytu
Szybkie odzyskiwanie po awarii dysku
Redundancja danych
Narzut dysku jest duży
Ograniczona pojemność
RAID 5

Mapuj dane na dyskach i przechowuj bity parzystości każdego paska danych na różnych dyskach w VD. Bit parzystości zawiera informacje, które mogą być użyte do rekonstrukcji danych z uszkodzonego dysku z innego dysku w przypadku awarii jednego dysku.
Błąd dysku
Awaria pojedynczego dysku
Efektywne wykorzystanie pojemności napędu
Wysoka wydajność odczytu
Średnia do wysoka wydajność zapisu
Umiarkowany wpływ awarii dysku
Ze względu na ponowne obliczenie parzystości, czas rekonstrukcji jest dłuższy
RAID 6

Mapuj dane na dyskach i przechowuj bity parzystości każdego paska danych na różnych dyskach w VD. W przeciwieństwie do RAID 5, RAID 6 wykonuje dwie obliczenia parzystości (P i Q), co pozwala mu przetrwać awarie dwóch dysków.
Redundancja danych
Wysoka wydajność odczytu
Błąd dysku
Awaria podwójnego dysku
Wydajność zapisu jest zmniejszona z powodu dwóch obliczeń parzystości
Ponieważ jest to równoważne użyciu 2 dysków dla parzystości, istnieje dodatkowy koszt
RAID 10

Paski na zestawie luster. Narzut dysku jest duży, ale to świetne rozwiązanie dla wysokiej wydajności, redundancji i szybkiego odzyskiwania w przypadku awarii dysku.
Błąd dysku
Jedna awaria dysku na zestaw obrazów
Wysoka wydajność odczytu
Można wspierać grupy RAID z maksymalnie 192 dyskami
Najwyższy koszt
RAID 50

Pasek RAID 5 na planie. Ograniczając liczbę odczytów dysku na obliczenie parzystości, wydajność RAID 5 można poprawić, w zależności od konfiguracji.
Błąd dysku
Jedna awaria dysku na przęsło
Wysoka wydajność odczytu
Średnia do wysoka wydajność zapisu
Można wspierać grupy RAID z maksymalnie 192 dyskami
Umiarkowany wpływ awarii dysku
Ze względu na ponowne obliczenie parzystości, czas rekonstrukcji jest dłuższy
RAID 60

Pasek RAID 6 na planie. Przy mniejszej liczbie odczytów dysku na obliczenie parzystości, wydajność RAID 6 może być poprawiona, w zależności od konfiguracji.
Błąd dysku
Dwa dyski ulegają awarii na przęsło
Wysoka wydajność odczytu
Można wspierać grupy RAID z maksymalnie 192 dyskami
Wydajność zapisu jest zmniejszona z powodu dwóch obliczeń parzystości
Ponieważ jest to równoważne użyciu 2 dysków dla parzystości, istnieje dodatkowy koszt


5. Różnice w oprogramowaniu i sprzęcie RAID

Soft RAID

Soft RAID nie posiada dedykowanego układu sterującego ani układu I/O, a system operacyjny i procesor realizują wszystkie funkcje RAID. Nowoczesne systemy operacyjne zasadniczo oferują wsparcie dla soft RAID, zapewniając oddzielenie między fizycznymi a logicznymi dyskami poprzez dodanie warstwy oprogramowania na sterownikach urządzeń dyskowych. Obecnie najczęściej obsługiwane przez system operacyjny oceny RAID to RAID0, RAID1, RAID10, RAID01 oraz RAID5. Na przykład Windows Server obsługuje RAID0, RAID1 i RAID5, Linux obsługuje RAID0, RAID1, RAID4, RAID5, RAID6 itd., a Mac OS X Server, FreeBSD, NetBSD, OpenBSD, Solaris i inne systemy operacyjne również obsługują odpowiadające poziomy RAID.

Zarządzanie konfiguracją i odzyskiwanie danych w soft RAID są stosunkowo proste, ale wszystkie zadania RAID są w pełni wykonywane przez CPU, na przykład obliczanie wartości kontrolnych, więc efektywność wykonania jest stosunkowo niska.

Soft RAID jest implementowany przez system operacyjny, więc partycja, na której znajduje się system, nie może być używana jako logiczny dysk członkowski RAID, a soft RAID nie chroni dysku systemowego D. W niektórych systemach operacyjnych informacje konfiguracyjne RAID są przechowywane w informacjach systemowych, a nie jako osobny plik na dysku. W ten sposób, gdy system niespodziewanie się zawieje i wymaga ponownej instalacji, informacje RAID są tracone. Ponadto technologia odporności na awarie dysku nie obsługuje w pełni wymiany online, hot swappingu ani hot swappingu, a to, czy może obsłużyć hot swap niewłaściwego dysku, zależy od implementacji systemu operacyjnego.

Hard RAID

Hard RAID posiada własne układy sterujące RAID i I/O, a nawet buforowanie macierzy, które jest najlepszym z trzech typów implementacji pod względem zużycia CPU i ogólnej wydajności, a jednocześnie wiąże się z najwyższymi kosztami implementacji. Hard RAID zazwyczaj obsługuje technologię hot-swapping, która zastępuje uszkodzone dyski podczas działania systemu.

Hard RAID składa się z karty RAID i układu RAID zintegrowanych na płycie głównej, a platformy serwerowe często korzystają z kart RAID. Karta RAID składa się z 4 części: rdzenia procesora RAID (CPU na karcie RAID), portu, pamięci podręcznej oraz baterii. Wśród nich porty odnoszą się do typów interfejsów dyskowych obsługiwanych przez karty RAID, takich jak IDE/ATA, SCSI, SATA, SAS, FC i inne interfejsy.

Mieszanka hard i soft RAID

Soft RAID nie jest zbyt dobry i nie chroni partycji systemowych, co utrudnia jego zastosowanie na komputerach stacjonarnych. Hard RAID jest bardzo drogi, a różne RAD-y są od siebie niezależne i niekompatybilne. Dlatego ludzie stosują kombinację oprogramowania i sprzętu do implementacji RAID, aby osiągnąć kompromis między wydajnością a kosztami, czyli wysoką wydajność kosztową.

Chociaż ten RAID wykorzystuje układ sterujący przetwarzaniem, aby zaoszczędzić koszty, jest często tańszy i ma słabszą moc obliczeniową, a większość zadań RAID jest nadal wykonywana przez CPU za pomocą sterowników firmware.


6. Wybór aplikacji RAID

Przy wyborze poziomu RAID obowiązują trzy główne czynniki: dostępność danych, wydajność I/O oraz koszt. Jeśli dostępność nie jest wymagana, wybierz RAID0 dla wysokiej wydajności. Jeśli dostępność i wydajność są ważne, a koszt nie jest kluczowy, wybierz RAID1 na podstawie liczby dysków. Jeśli dostępność, koszt i wydajność są równie ważne, wybierz RAID3 lub RAID5 na podstawie ogólnego transferu danych i liczby dysków. W praktycznych zastosowaniach odpowiedni poziom RAID powinien być wybierany na podstawie cech i specyficznych warunków aplikacji danych użytkownika, biorąc pod uwagę dostępność, wydajność i koszty.




Poprzedni:Regularnie wykonuj kopie zapasowe zdalnych baz danych MySQL w środowiskach Linux
Następny:Docker MySQL rozwiązuje problem zbyt wielu połączeń
 Ziemianin| Opublikowano 2021-10-29 09:16:23 |
Pomóż mi wybrać: konfiguracja RAIDhttps://www.dell.com/zh-cn/work/ ... -raid-configuration
Zrzeczenie się:
Całe oprogramowanie, materiały programistyczne lub artykuły publikowane przez Code Farmer Network służą wyłącznie celom edukacyjnym i badawczym; Powyższe treści nie mogą być wykorzystywane do celów komercyjnych ani nielegalnych, w przeciwnym razie użytkownicy ponoszą wszelkie konsekwencje. Informacje na tej stronie pochodzą z Internetu, a spory dotyczące praw autorskich nie mają z nią nic wspólnego. Musisz całkowicie usunąć powyższą zawartość z komputera w ciągu 24 godzin od pobrania. Jeśli spodoba Ci się program, wspieraj oryginalne oprogramowanie, kup rejestrację i korzystaj z lepszych, autentycznych usług. W przypadku naruszenia praw prosimy o kontakt mailowy.

Mail To:help@itsvse.com