Este artigo é um artigo espelhado de tradução automática, por favor clique aqui para ir para o artigo original.

Vista: 11848|Resposta: 1

Explicação da Tecnologia RAID - Comparação de RAID0, RAID1, RAID3, RAID5, RAID6, RAID10

[Copiar link]
Postado em 2021-10-3 20:57:56 | | | |
1. Visão geral do RAID

Em 1988, a Universidade da Califórnia, Berkeley, propôs o conceito de RAID (RedundantArrayofIncheapDisks), e à medida que o custo dos discos continuava a cair, o RAID tornou-se (RedundantArrayofIndependentDisks), mas a substância não mudou. SNIA, Berkeley e outras organizações definiram os sete níveis de RAID0~RAID6 como níveis padrão de RAID, e o RAID padrão pode ser combinado em outros níveis de RAID, sendo os níveis mais usados RAID0, RAID1, RAID3, RAID5, RAID6 e RAID10. Cada nível RAID representa um método de implementação e uma tecnologia, e não há distinção entre os níveis. Em aplicações práticas, o nível RAID apropriado e os métodos específicos de implementação devem ser selecionados com base nas características da aplicação de dados do usuário, considerando disponibilidade, desempenho e custo.

Do ponto de vista da implementação, o RAID é dividido principalmente em três tipos: RAID suave, RAID rígido e RAID híbrido. Todas as funções do soft RAID são realizadas pelo sistema operacional e pela CPU, que é naturalmente a menos eficiente. O RAID rígido é equipado com chips especializados de controle/processamento RAID e chips de processamento de I/O e buffers de array, que não consomem recursos da CPU, mas são caros. O RAID híbrido possui chips de controle/processamento RAID, mas não possui chips de processamento de I/O, que requerem CPU e drivers para serem concluídos, e o desempenho e o custo ficam entre RAID suave e rígido.

2. Princípios básicos

RAID é um subsistema de disco composto por múltiplos discos independentes e de alto desempenho, proporcionando assim maior desempenho de armazenamento e tecnologia de redundância de dados do que um único disco. RAID é uma classe de tecnologia de gerenciamento multi-disco que oferece armazenamento de alto desempenho com alta confiabilidade de dados a um custo acessível para o ambiente hospedeiro. Os dois principais objetivos do RAID são melhorar a confiabilidade dos dados e o desempenho das E/S. Em um array de discos, os dados estão espalhados por múltiplos discos, mas para um sistema de computador, é como um único disco. A redundância é alcançada gravando os mesmos dados em vários discos ao mesmo tempo (tipicamente como espelhamento) ou gravando dados de verificação computados em um array, garantindo que a perda de dados não seja causada quando um único disco falha.

Existem três conceitos e técnicas principais em RAID: Espelhamento, DataStripping e Dataparity:

O espelhamento, que replica dados para múltiplos discos, melhora a confiabilidade por um lado e melhora o desempenho de leitura ao ler dados de duas ou mais réplicas simultaneamente. Obviamente, o desempenho de escrita da imagem é um pouco menor, e leva mais tempo para garantir que os dados sejam gravados corretamente em múltiplos discos.
O data striping, que armazena fragmentos de dados em múltiplos discos diferentes, e múltiplos fragmentos de dados juntos formam uma cópia completa dos dados, o que é diferente de múltiplas cópias do espelhamento, e é frequentemente usado para considerações de desempenho. As data strips têm maior granularidade de concorrência e, quando dados são acessados, podem ler e gravar dados em diferentes discos ao mesmo tempo, resultando em uma melhoria muito significativa no desempenho de I/O.
A verificação de dados, usando dados redundantes para detecção e reparo de erros, dados redundantes geralmente é calculada por código de Hemingway, operação XOR e outros algoritmos. A função de verificação pode melhorar significativamente a confiabilidade, roubo e tolerância a falhas dos arrays de discos. No entanto, a validação de dados exige que os dados sejam lidos de múltiplas fontes, calculados e comparados, o que pode afetar o desempenho do sistema.
Diferentes níveis de RAID empregam uma ou mais das três tecnologias para alcançar diferentes confiabilidades, disponibilidade e desempenho de E/S de dados. Quanto a qual RAID projetar (ou mesmo um novo grau ou tipo) ou qual modo de RAID usar, é necessário fazer uma escolha razoável baseada em um entendimento profundo das necessidades do sistema e avaliar abrangente a confiabilidade, desempenho e custo para fazer um compromisso.

De modo geral, as principais vantagens do RAID são: grande capacidade, alto desempenho, confiabilidade e facilidade de gerenciamento.

3. Classificação RAID

JBOD (JustaBunchOfDisks) não é um nível RAID padrão, sendo frequentemente usado para representar um conjunto de discos que não possuem software de controle para fornecer controle coordenado. O JBOD conecta múltiplos discos físicos em série para fornecer um enorme disco lógico. O desempenho de armazenamento é exatamente o mesmo de um único disco, e não oferece segurança dos dados. A capacidade de armazenamento disponível é igual à soma do espaço de armazenamento de todos os discos membros.

RAID0, chamado de striping, é uma tecnologia simples e não verificada de data striping. O desempenho é o mais alto de todos os níveis RAID. Não são fornecidas políticas de demissão de qualquer tipo. Utilização total do espaço de armazenamento.

RAID1 é chamado de espelhamento, e ele grava dados no disco de trabalho e no disco espelhado de forma completamente consistente, e tem uma utilização de espaço em disco de 50%. O desempenho é afetado quando os dados são escritos, mas os dados não são lidos. Ele oferece a melhor proteção de dados; uma vez que o disco funcional falha, o sistema lê automaticamente os dados do disco espelhado, o que não afetará o trabalho do usuário.

O RAID2 é chamado de Heming Code Disk Array, e sua ideia de design é usar o Heming Code para alcançar redundância de verificação de dados. Quanto maior a largura dos dados, maior a utilização do espaço de armazenamento, mas mais discos você precisa. Ele tem a capacidade de corrigir erros, mas a sobrecarga de redundância de dados do Hemingcode é grande demais e a reconstrução de dados é muito demorada, então o RAID2 raramente é usado na prática.

O RAID3 é chamado de faixa de paridade dedicada, que usa um disco dedicado como disco de verificação e o restante dos discos como disco de dados, e os dados são armazenados cruzadamente em cada disco de dados em bits e bytes. RAID3 requer pelo menos três discos.

RAID4 e RAID3 funcionam com princípios muito semelhantes. Oferece desempenho de leitura muito bom, mas desempenho ruim na escrita. E à medida que o número de discos membros aumenta, o gargalo do sistema do disco de soma de verificação se tornará mais proeminente. É raro em aplicações do mundo real, e produtos de armazenamento convencionais raramente usam proteção RAID4.

O RAID5 é chamado de faixa de verificação de paridade distribuída, que deveria ser o nível RAID mais comum atualmente, e o princípio é semelhante ao do RAID4, mas não há gargalo no desempenho do disco de verificação durante operações de gravação concorrentes no RAID4.

O RAID6, chamado de double parity strip, introduz o conceito de verificações duplas para resolver o problema da integridade dos dados quando dois discos falham ao mesmo tempo, algo que outras classes RAID não conseguem resolver. No entanto, custa muito mais que o RAID5, tem baixo desempenho de escrita e é muito complexo de projetar e implementar. Portanto, o RAID6 raramente é usado na prática e geralmente é uma alternativa econômica às soluções RAID10.

Os níveis padrão de RAID têm seus pontos fortes e fracos. Combinar múltiplos níveis de RAID para obter vantagens complementares e compensar as deficiências uns dos outros, de modo a alcançar um sistema RAID com maior desempenho, segurança de dados e outros indicadores. Claro, o custo de implementação do nível combinado é geralmente muito caro e é usado apenas em alguns casos específicos. Na verdade, apenas RAID01 e RAID10 são amplamente utilizados.

O RAID01 é primeiro listrado e depois espelhado, o que basicamente serve para imagear o disco físico; RAID10 é para a imagem primeiro e depois para a lisca, que é para a imagem do disco virtual. Na mesma configuração, o RAID01 geralmente tem melhor tolerância a falhas do que o RAID10. O RAID01 combina as vantagens do RAID0 e do RAID1, com uma utilização geral de disco de apenas 50%.


4. Comparação dos níveis principais de RAID



Configuração RAID

Nível/Descrição:
Tolerância a falhas
mérito
deficiência
RAID 0

Mapeie dados entre drives para criar discos virtuais grandes. Como cada disco físico processa apenas uma parte da solicitação, ele pode oferecer desempenho maior. No entanto, se um dos discos falhar, o disco virtual (VD) se tornará inacessível e os dados serão perdidos permanentemente.
não
Melhor desempenho
Armazenamento adicional
Não deve ser usado para dados críticos
RAID 1

Espelhar dados, armazenar redundância de dados em dois discos. Se um disco falhar, o outro disco assumirá como unidade principal.
Erro de disco
Falha de disco único
Desempenho de leitura alta
Recuperação rápida após uma falha no disco
Redundância de dados
A sobrecarga do disco é grande
Capacidade limitada
RAID 5

Mapeie os dados entre os drives e armazene os bits de paridade de cada data strip em diferentes drives no VD. O bit de paridade contém informações que podem ser usadas para reconstruir dados de um disco com falha de outro disco no caso de uma única falha de disco.
Erro de disco
Falha de disco único
Uso eficiente da capacidade de acionamento
Desempenho de leitura alta
Desempenho de escrita médio a alto
Impacto moderado de falha do disco
Devido ao recálculo da paridade, o tempo de reconstrução é maior
RAID 6

Mapeie os dados entre os drives e armazene os bits de paridade de cada data strip em diferentes drives no VD. Diferentemente do RAID 5, o RAID 6 realiza dois cálculos de paridade (P e Q), permitindo que suporte falhas em dois discos.
Redundância de dados
Desempenho de leitura alta
Erro de disco
Falha de disco duplo
O desempenho de escrita é reduzido devido a dois cálculos de paridade
Como é equivalente a usar 2 discos para paridade, há um custo adicional
RAID 10

Tiras no conjunto de espelhos. A sobrecarga do disco é alta, mas é uma ótima solução para alto desempenho, redundância e recuperação rápida em caso de falha no disco.
Erro de disco
Uma falha de disco por conjunto de imagem
Desempenho de leitura alta
Grupos RAID com até 192 discos podem ser suportados
O custo mais alto
RAID 50

Tira RAID 5 no set. Ao reduzir as leituras em disco por cálculo de paridade, o desempenho pode ser melhorado com RAID 5, dependendo da configuração.
Erro de disco
Uma falha de disco por vão
Desempenho de leitura alta
Desempenho de escrita médio a alto
Grupos RAID com até 192 discos podem ser suportados
Impacto moderado de falha do disco
Devido ao recálculo da paridade, o tempo de reconstrução é maior
RAID 60

Tira RAID 6 no set. Com menos leituras de disco por cálculo de paridade, o desempenho pode ser melhorado com RAID 6, dependendo da configuração.
Erro de disco
Dois discos falham por vão
Desempenho de leitura alta
Grupos RAID com até 192 discos podem ser suportados
O desempenho de escrita é reduzido devido a dois cálculos de paridade
Como é equivalente a usar 2 discos para paridade, há um custo adicional


5. Diferença entre software e hardware RAID

Soft RAID

O Soft RAID não possui um chip de controle dedicado nem um chip de E/S, e o sistema operacional e a CPU implementam todas as funções RAID. Sistemas operacionais modernos basicamente oferecem suporte a RAID soft, fornecendo uma abstração entre unidades físicas e lógicas ao adicionar uma camada de software sobre os drivers de dispositivos de disco. Atualmente, as classificações RAID mais comuns suportadas pelo sistema operacional são RAID0, RAID1, RAID10, RAID01 e RAID5. Por exemplo, o Windows Server suporta RAID0, RAID1 e RAID5, Linux suporta RAID0, RAID1, RAID4, RAID5, RAID6, etc., e Mac OS X Server, FreeBSD, NetBSD, OpenBSD, Solaris e outros sistemas operacionais também suportam níveis RAID correspondentes.

O gerenciamento de configuração e a recuperação de dados do RAID suave são relativamente simples, mas todas as tarefas do RAID são completamente realizadas pela CPU, como o cálculo dos valores de verificação, então a eficiência de execução é relativamente baixa.

O RAID Soft é implementado pelo sistema operacional, então a partição onde o sistema está localizado não pode ser usada como um disco membro lógico do RAID, e o RAID suave não pode proteger o disco D do sistema. Para alguns sistemas operacionais, as informações de configuração RAID são armazenadas em informações do sistema, em vez de serem um arquivo separado no disco. Dessa forma, quando o sistema trava inesperadamente e precisa ser reinstalado, as informações RAID são perdidas. Além disso, a tecnologia de tolerância a falhas do disco não suporta totalmente a substituição online, troca a quente ou troca a quente, e a possibilidade de suportar a troca a quente do disco errado está relacionada à implementação do sistema operacional.

RAID Rígido

O Hard RAID possui seus próprios chips de processamento de controle RAID e processamento de E/S, além de buffer de array, que é o melhor dos três tipos de implementações em termos de uso de CPU e desempenho geral, mas também tem o maior custo de implementação. O RAID rígido normalmente suporta a tecnologia de troca a quente, que substitui discos com defeito enquanto o sistema está em rodamento.

O RAID rígido consiste em uma placa RAID e um chip RAID integrados à placa-mãe, e plataformas de servidor frequentemente utilizam placas RAID. Uma placa RAID consiste em 4 partes: o chip de processamento do núcleo RAID (a CPU da placa RAID), a porta, o cache e a bateria. Entre elas, ports referem-se aos tipos de interfaces de disco suportadas por placas RAID, como IDE/ATA, SCSI, SATA, SAS, FC e outras interfaces.

RAID misto hard e soft

Soft RAID não é muito bom e não protege partições do sistema, tornando difícil sua aplicação em sistemas desktop. RAID rígido é muito caro, e diferentes RADs são independentes uns dos outros e não interoperáveis. Portanto, as pessoas adotam uma combinação de software e hardware para implementar RAID, a fim de obter um compromisso entre desempenho e custo, ou seja, um desempenho de alto custo.

Embora esse RAID utilize um chip de controle de processamento, para economizar custos, o chip costuma ser mais barato e tem poder de processamento menor, e a maior parte do processamento de tarefas do RAID ainda é feita pela CPU por meio de drivers de firmware.


6. Seleção de aplicações RAID

Existem três fatores principais na escolha de um nível RAID: disponibilidade de dados, desempenho de E/S e custo. Se a disponibilidade não for necessária, escolha RAID0 para alto desempenho. Se disponibilidade e desempenho forem importantes e o custo não for um fator importante, escolha RAID1 com base no número de discos. Se disponibilidade, custo e desempenho forem igualmente importantes, escolha RAID3 ou RAID5 com base na transferência geral de dados e na contagem de discos. Em aplicações práticas, o nível RAID apropriado deve ser selecionado com base nas características e condições específicas da aplicação de dados do usuário, considerando disponibilidade, desempenho e custo.




Anterior:Backup regular de bancos de dados MySQL remotos em ambientes Linux
Próximo:Docker MySQL resolve o problema de conexões demais
 Senhorio| Postado em 29-10-2021 09:16:23 |
Me ajude a escolher: configuração RAIDhttps://www.dell.com/zh-cn/work/ ... -raid-configuration
Disclaimer:
Todo software, material de programação ou artigos publicados pela Code Farmer Network são apenas para fins de aprendizado e pesquisa; O conteúdo acima não deve ser usado para fins comerciais ou ilegais, caso contrário, os usuários terão todas as consequências. As informações deste site vêm da Internet, e disputas de direitos autorais não têm nada a ver com este site. Você deve deletar completamente o conteúdo acima do seu computador em até 24 horas após o download. Se você gosta do programa, por favor, apoie um software genuíno, compre o registro e obtenha serviços genuínos melhores. Se houver qualquer infração, por favor, entre em contato conosco por e-mail.

Mail To:help@itsvse.com