O cabeçalho RAID1 vs RAID10 do software de 4 unidades informa o que estou pensando.
Hardware: 2 HDDs de classe empresarial de 1 TB + 2 HDDs de classe de consumo de 1 TB.
SO e Software: Linux Debian Jessie (estável) com mdadm
.
Finalidade pretendida: Armazenamento de extrema confiabilidade. Não pode permitir a perda de dados. Tal coisa seria simplesmente inaceitável. É por isso que estou considerando RAID1 em vez de RAID10, porque a tolerância a falhas com RAID1 deve ser uma falha de 3 unidades.
Vejo uma desvantagem: limitar o tamanho do armazenamento global a 1/4. Louco.
Tirando esta decisão RAID1 vs RAID10, que provavelmente já tomei, RAID1 ou seja, salvo indicação em contrário, tenho uma questão relativamente ao RAID1:
Supondo que eu esteja limitado a 4 unidades, eu teria possibilidades limitadas com RAID10, ao contrário de RAID1, onde poderia definir 3 unidades ativas e a 4ª como sobressalente. Isso ou definir diretamente 4 HDDs ativos.
Por favor diga-me o que você pensa?
Em tal configuração (somente 4 discos e RAID1), é melhor usar diretamente o 4º disco como membro da matriz em vez de sobressalente.
Usá-lo como um sobressalente não comprará nada no lado da redundância, enquanto usar o 4º disco como um membro completo da matriz aumenta sua redundância de 3 para 4 cópias, permitindo que você sobreviva a falhas de 3 discos.
De qualquer forma, se você está tão preocupado com a redundância/disponibilidade de dados a ponto de perder 3/4 do seu espaço bruto, provavelmente está abordando o problema pelo lado errado.
Lembre-se: RAID não é backup!!!
Em vez de aumentar sua configuração de RAID1 em espelho de 3 vias, certifique-se de ter um plano de backup/recuperação forte.
Se você procura um sistema com alta disponibilidade e está preocupado com o travamento dos drives, o RAID1 é com certeza a melhor solução. Mas se você quiser mais espaço, um RAID6 pode ser um compromisso. Você "perde" o espaço de dois discos para paridade, mas também economiza até dois discos com falha.
Se a alta disponibilidade é realmente sua preocupação, talvez você também deva pensar em um segundo servidor sincronizado. Se a perda de dados é sua preocupação, você deve primeiro certificar-se de ter um bom backup. Um RAID nunca é um substituto para backups, pois protege apenas contra discos com falha, não contra exclusão acidental de dados, malware ou invasor criptografando ou excluindo seus dados e assim por diante.
Concordo, se você tiver requisitos tão rígidos para armazenamento, também recomendaria a abordagem de vários nós. Atualmente, estamos executando repositório de backup de 2 nós com arrays RAID 10 em cada um dos servidores. Parece estável e redundante.
Se você está tão preocupado com a disponibilidade e integridade dos dados e está disposto a fazer algo como um RAID-1 de quatro membros para obtê-lo, provavelmente deve procurar redundância no nível do nó.
Não importa quantos discos você coloque em um controlador, ainda há um único ponto de falha, que é a própria máquina. Em vez de se preocupar com a redundância no nível do RAID, você pode implementar algo como DRDB, GlusterFS ou Ceph.
O DRDB agiria mais como um RAID-1 de rede, para descrevê-lo de forma simplista. O Gluster e o Ceph também podem se comportar dessa maneira, mas também podem escalar massivamente tanto replicando para nós quanto distribuindo dados entre conjuntos de réplicas.
Você ainda pode implementar o RAID no nível do nó usando esses tipos de armazenamento, mas com esses sistemas de replicação entre nós, isso se torna muito menos preocupante e reduz a escalabilidade em implantações maiores. Também é fácil retirar um nó inteiro do cluster, corrigi-lo e colocá-lo de volta. Nas nuvens de armazenamento, o RAID está sendo usado cada vez com menos frequência por esses motivos.