Este artículo es un artículo espejo de traducción automática, por favor haga clic aquí para saltar al artículo original.

Vista: 11848|Respuesta: 1

Explicación de la tecnología RAID - Comparación de RAID0, RAID1, RAID3, RAID5, RAID6, RAID10

[Copiar enlace]
Publicado el 3-10-2021 20:57:56 | | | |
1. Resumen del RAID

En 1988, la Universidad de California, Berkeley, propuso el concepto de RAID (RedundantArrayofIncheapDisks), y a medida que el coste de los discos seguía disminuyendo, RAID se convirtió en RedundantArrayofIndependentDisks, pero la sustancia no cambió. SNIA, Berkeley y otras organizaciones han establecido los siete niveles de RAID0~RAID6 como niveles estándar de RAID, y el RAID estándar puede combinarse en otros niveles RAID, siendo los niveles más utilizados RAID0, RAID1, RAID3, RAID5, RAID6 y RAID10. Cada nivel RAID representa un método de implementación y una tecnología, y no hay distinción entre niveles. En aplicaciones prácticas, el nivel RAID adecuado y los métodos de implementación específicos deben seleccionarse en función de las características de la aplicación de datos del usuario, considerando la disponibilidad, el rendimiento y el coste.

Desde la perspectiva de la implementación, RAID se divide principalmente en tres tipos: RAID blando, RAID duro y RAID híbrido. Todas las funciones del RAID suave las realiza el sistema operativo y la CPU, que es naturalmente el menos eficiente. El RAID Duro está equipado con chips especializados de control/procesamiento RAID y chips de procesamiento de E/S y búferes de array, que no consumen recursos de la CPU pero resultan costosos. El RAID híbrido tiene chips de control/procesamiento RAID, pero carece de chips de procesamiento de E/S, que requieren CPU y controladores para completarse, y el rendimiento y coste están entre RAID blando y duro.

2. Principios básicos

RAID es un subsistema de disco que consiste en múltiples unidades de disco independientes y de alto rendimiento, lo que proporciona un mayor rendimiento de almacenamiento y tecnología de redundancia de datos que un solo disco. RAID es una clase de tecnología de gestión multidisco que proporciona almacenamiento de alto rendimiento con alta fiabilidad de datos a un coste asequible para el entorno anfitrión. Los dos objetivos clave de RAID son mejorar la fiabilidad de los datos y el rendimiento de E/S. En un array de discos, los datos están distribuidos entre varios discos, pero para un sistema informático, es como un solo disco. La redundancia se consigue escribiendo los mismos datos en varios discos al mismo tiempo (normalmente como el espejado) o escribiendo datos de comprobación computados en un array, asegurando que la pérdida de datos no se cause cuando un solo disco falla.

Existen tres conceptos y técnicas principales en RAID: Espejado, DataRiping y Paridad de Datos:

El espejamiento, que replica datos a varios discos, mejora la fiabilidad por un lado y mejora el rendimiento de lectura al leer datos de dos o más réplicas simultáneamente. Obviamente, el rendimiento de escritura de la imagen es ligeramente inferior y se tarda más en asegurarse de que los datos se escriben correctamente en varios discos.
El data striping, que almacena fragmentos de datos en múltiples discos diferentes, y múltiples fragmentos de datos juntos forman una copia completa de los datos, lo cual es diferente de múltiples copias de espejado, y a menudo se utiliza para consideraciones de rendimiento. Las tiras de datos tienen una mayor granularidad de concurrencia y, cuando se accede a datos, pueden leer y escribir datos en diferentes discos al mismo tiempo, lo que resulta en una mejora muy significativa en el rendimiento de E/S.
La verificación de datos, utilizando datos redundantes para la detección y reparación de errores de datos, los datos redundantes suelen calcularse mediante código de Hemingway, operación XOR y otros algoritmos. La función de verificación puede mejorar considerablemente la fiabilidad, el robo y la tolerancia a fallos de los arrays de discos. Sin embargo, la validación de datos requiere que los datos sean leídos de múltiples fuentes, calculados y comparados, lo que puede afectar al rendimiento del sistema.
Diferentes grados de RAID emplean una o más de las tres tecnologías para lograr distintas fiabilidades, disponibilidad y rendimiento de E/S de los datos. En cuanto a qué RAID diseñar (o incluso una nueva calidad o tipo) o qué modo de RAID utilizar, es necesario tomar una decisión razonable basada en un profundo conocimiento de las necesidades del sistema y evaluar de forma exhaustiva la fiabilidad, el rendimiento y el coste para llegar a un compromiso.

En términos generales, las principales ventajas del RAID son: gran capacidad, alto rendimiento, fiabilidad y manejabilidad.

3. Calificación RAID

JBOD (JustaBunchOfDisks) no es un nivel RAID estándar, a menudo se utiliza para representar un conjunto de discos que no tienen software de control para proporcionar control coordinado. JBOD conecta múltiples discos físicos en serie para proporcionar un disco lógico enorme. El rendimiento del almacenamiento es exactamente el mismo que el de un solo disco y no proporciona seguridad de los datos. La capacidad de almacenamiento disponible es igual a la suma del espacio de almacenamiento de todos los discos miembros.

RAID0, llamado striping, es una tecnología sencilla y sin control de striping de datos. El rendimiento es el más alto de todos los niveles RAID. No se proporcionan políticas de despido de ningún tipo. Aprovechación del espacio de almacenamiento al 100%.

RAID1 se llama espejado, y escribe datos en el disco de trabajo y en el disco espejado de forma completamente consistente, y tiene una utilización del espacio en disco del 50%. El rendimiento se ve afectado cuando se escriben datos, pero no se leen. Proporciona la mejor protección de datos; una vez que el disco funcional falla, el sistema lee automáticamente los datos del disco espejado, lo que no afectará al trabajo del usuario.

RAID2 se llama Heming Code Disk Array, y su idea de diseño es usar Heming Code para lograr redundancia de verificación de datos. Cuanto mayor es el ancho de los datos, mayor es la utilización del espacio de almacenamiento, pero más discos necesitas. Tiene la capacidad de corregir errores, pero la sobrecarga de redundancia de datos de Hemingcode es demasiado grande y la reconstrucción de datos consume mucho tiempo, por lo que RAID2 rara vez se utiliza en la práctica.

RAID3 se llama tira de paridad dedicada, que utiliza un disco dedicado como disco de comprobación y el resto de los discos como disco de datos, y los datos se almacenan cruzados en cada disco de datos en bits y bytes. RAID3 requiere al menos tres discos.

RAID4 y RAID3 funcionan con un principio muy similar. Ofrece un rendimiento de lectura muy bueno, pero un rendimiento de escritura pobre. Y a medida que aumenta el número de discos miembros, el cuello de botella del sistema del disco de suma de comprobación se hará más evidente. Es poco común en aplicaciones reales, y los productos de almacenamiento convencionales rara vez usan protección RAID4.

RAID5 se llama banda de suma de comprobación de paridad distribuida, que debería ser el nivel RAID más común actualmente, y el principio es similar al de RAID4, pero no existe un cuello de botella en el rendimiento del disco de comprobación durante operaciones de escritura concurrentes en RAID4.

RAID6, llamado doble paridad strip, introduce el concepto de doble comprobación para resolver el problema de la integridad de los datos cuando dos discos fallan al mismo tiempo que otras clases RAID no pueden resolver. Sin embargo, cuesta mucho más que RAID5, tiene un bajo rendimiento de escritura y es muy complejo de diseñar e implementar. Por lo tanto, RAID6 rara vez se utiliza en la práctica y generalmente es una alternativa económica a las soluciones RAID10.

Los niveles estándar de RAID tienen sus puntos fuertes y débiles. Combinar múltiples niveles de RAID para lograr ventajas complementarias y compensar las carencias de cada uno, con el fin de lograr un sistema RAID con mayor rendimiento, seguridad de datos y otros indicadores. Por supuesto, el coste de implementación del nivel de combinación suele ser muy elevado y solo se utiliza en unos pocos casos específicos. De hecho, solo RAID01 y RAID10 se usan ampliamente.

RAID01 se hace primero rayado y luego se espeja, lo que esencialmente sirve para obtener imágenes del disco físico; RAID10 es primero la imagen y luego la raya, que es la imagen del disco virtual. Bajo la misma configuración, RAID01 suele tener mejor tolerancia a fallos que RAID10. RAID01 combina las ventajas de RAID0 y RAID1, con una utilización total del disco de solo el 50%.


4. Comparación de los niveles RAID principales



Configuración RAID

Nivel/Descripción:
Tolerancia a fallos
mérito
defecto
RAID 0

Mapea datos entre unidades para crear discos virtuales grandes. Como cada disco físico solo procesa una parte de la solicitud, puede proporcionar un mayor rendimiento. Sin embargo, si una unidad falla, el disco virtual (VD) se volverá inaccesible y los datos se perderán de forma permanente.
no
Mejor rendimiento
Almacenamiento adicional
No debe usarse para datos críticos
RAID 1

Espejo de datos, almacena redundancia de datos en dos discos. Si un disco falla, el otro disco pasará a ser el disco principal.
Error de disco
Fallo de un solo disco
Rendimiento de alta lectura
Recuperarse rápidamente tras una avería de disco
Redundancia de datos
La sobrecarga del disco es grande
Capacidad limitada
RAID 5

Mapea datos entre discos y almacena los bits de paridad de cada strip de datos en diferentes discos en VD. El bit de paridad contiene información que puede usarse para reconstruir datos de un disco fallido de otro disco en caso de fallo de un solo disco.
Error de disco
Fallo de un solo disco
Uso eficiente de la capacidad de transmisión
Rendimiento de alta lectura
Rendimiento de escritura de medio a alto
Impacto moderado en fallos de disco
Debido al recálculo de la paridad, el tiempo de reconstrucción es más largo
RAID 6

Mapea datos entre discos y almacena los bits de paridad de cada strip de datos en diferentes discos en VD. A diferencia de RAID 5, RAID 6 realiza dos cálculos de paridad (P y Q), lo que le permite resistir fallos en dos discos.
Redundancia de datos
Rendimiento de alta lectura
Error de disco
Fallo de disco dual
El rendimiento de escritura se reduce debido a dos cálculos de paridad
Dado que equivale a usar 2 discos para la paridad, hay un coste adicional
RAID 10

Tiras en el juego de espejos. La sobrecarga del disco es alta, pero es una gran solución para alto rendimiento, redundancia y recuperación rápida en caso de fallo de la unidad.
Error de disco
Un fallo de disco por conjunto de imágenes
Rendimiento de alta lectura
Se pueden soportar grupos RAID con hasta 192 discos
El coste más alto
RAID 50

Tira RAID 5 en el set. Reduciendo las lecturas de disco por cálculo de paridad, el rendimiento puede mejorarse con RAID 5, dependiendo de la configuración.
Error de disco
Un fallo de disco por tramo
Rendimiento de alta lectura
Rendimiento de escritura de medio a alto
Se pueden soportar grupos RAID con hasta 192 discos
Impacto moderado en fallos de disco
Debido al recálculo de la paridad, el tiempo de reconstrucción es más largo
RAID 60

Tira RAID 6 en el set. Con menos lecturas de disco por cálculo de paridad, el rendimiento puede mejorarse con RAID 6, dependiendo de la configuración.
Error de disco
Dos discos fallan por tramo
Rendimiento de alta lectura
Se pueden soportar grupos RAID con hasta 192 discos
El rendimiento de escritura se reduce debido a dos cálculos de paridad
Dado que equivale a usar 2 discos para la paridad, hay un coste adicional


5. Diferencia entre software y hardware RAID

RAID suave

Soft RAID no tiene un chip de control dedicado ni un chip de E/S, y el sistema operativo y la CPU implementan todas las funciones RAID. Los sistemas operativos modernos básicamente ofrecen soporte suave para RAID, proporcionando una abstracción entre unidades físicas y lógicas al añadir una capa de software sobre los controladores de dispositivos de disco. Actualmente, las clasificaciones RAID más comunes soportadas por el sistema operativo son RAID0, RAID1, RAID10, RAID01 y RAID5. Por ejemplo, Windows Server soporta RAID0, RAID1 y RAID5, Linux soporta RAID0, RAID1, RAID4, RAID5, RAID6, etc., y Mac OS X Server, FreeBSD, NetBSD, OpenBSD, Solaris y otros sistemas operativos también soportan los niveles RAID correspondientes.

La gestión de configuración y la recuperación de datos del RAID suave son relativamente sencillas, pero todas las tareas RAID son completas completamente por la CPU, como el cálculo de valores de comprobación, por lo que la eficiencia de ejecución es relativamente baja.

El RAID suave lo implementa el sistema operativo, por lo que la partición donde se encuentra el sistema no puede usarse como disco miembro lógico de RAID, y el RAID suave no puede proteger el disco D del sistema. En algunos sistemas operativos, la información de configuración RAID se almacena en la información del sistema en lugar de como un archivo separado en disco. De este modo, cuando el sistema se bloquea inesperadamente y necesita ser reinstalado, se pierde la información RAID. Además, la tecnología de tolerancia a fallos del disco no soporta completamente el reemplazo online, el intercambio en caliente o el intercambio en caliente, y si puede soportar el cambio en caliente del disco equivocado está relacionado con la implementación del sistema operativo.

RAID Duro

El RAID Duro tiene su propio procesamiento de control RAID y chips de procesamiento de E/S, e incluso almacenamiento en búfer de arrays, que es el mejor de los tres tipos de implementaciones en términos de uso de CPU y rendimiento general, pero también tiene el mayor coste de implementación. El RAID rígido suele soportar la tecnología de intercambio en caliente, que sustituye discos fallidos mientras el sistema está en funcionamiento.

El RAID Duro consiste en una tarjeta RAID y un chip RAID integrados en la placa base, y las plataformas de servidor suelen usar tarjetas RAID. Una tarjeta RAID consta de 4 partes: el chip de procesamiento del núcleo RAID (la CPU de la tarjeta RAID), el puerto, la caché y la batería. Entre ellas, puertos se refieren a los tipos de interfaces de disco soportadas por tarjetas RAID, como IDE/ATA, SCSI, SATA, SAS, FC y otras interfaces.

RAID mixto duro y blando

El RAID suave no es muy bueno y no protege las particiones del sistema, lo que dificulta su aplicación en sistemas de escritorio. El RAID rígido es muy caro, y los diferentes RADs son independientes entre sí y no son interoperables. Por ello, las personas adoptan una combinación de software y hardware para implementar RAID, con el fin de lograr un compromiso entre rendimiento y coste, es decir, un alto coste y rendimiento.

Aunque este RAID utiliza un chip de control de procesamiento, para ahorrar costes, el chip suele ser más barato y tiene menor potencia de procesamiento, y la mayor parte del procesamiento de tareas del RAID sigue siendo realizado por la CPU mediante controladores de firmware.


6. Selección de aplicaciones RAID

Hay tres factores principales a la hora de elegir un nivel RAID: disponibilidad de datos, rendimiento de E/S y coste. Si no se requiere disponibilidad, elige RAID0 para alto rendimiento. Si la disponibilidad y el rendimiento son importantes y el coste no es un factor importante, elige RAID1 en función del número de discos. Si la disponibilidad, el coste y el rendimiento son igualmente importantes, elige RAID3 o RAID5 en función de la transferencia general de datos y el número de discos. En aplicaciones prácticas, el nivel RAID adecuado debe seleccionarse en función de las características y condiciones específicas de la aplicación de datos del usuario, considerando la disponibilidad, el rendimiento y el coste.




Anterior:Hacer copias de seguridad regulares de bases de datos MySQL remotas en entornos Linux
Próximo:Docker MySQL resuelve el problema de demasiadas conexiones
 Propietario| Publicado el 29-10-2021 09:16:23 |
Ayúdame a elegir: configuración RAIDhttps://www.dell.com/zh-cn/work/ ... -raid-configuration
Renuncia:
Todo el software, materiales de programación o artículos publicados por Code Farmer Network son únicamente para fines de aprendizaje e investigación; El contenido anterior no se utilizará con fines comerciales o ilegales; de lo contrario, los usuarios asumirán todas las consecuencias. La información de este sitio proviene de Internet, y las disputas de derechos de autor no tienen nada que ver con este sitio. Debes eliminar completamente el contenido anterior de tu ordenador en un plazo de 24 horas desde la descarga. Si te gusta el programa, por favor apoya el software genuino, compra el registro y obtén mejores servicios genuinos. Si hay alguna infracción, por favor contáctanos por correo electrónico.

Mail To:help@itsvse.com