Atualmente, estou analisando o RAID 5 para meus dados crescentes para o meu PC doméstico e algumas coisas ainda não estão claras para mim. Atualmente, tenho backup de cada uma das minhas unidades por uma unidade de "backup" adicional e uso apenas scripts personalizados para fazer backup dos meus dados com frequência. Atualmente, tenho 4 unidades de dados, mais 4 unidades para fazer backup deles (mais 1 unidade de dados inúteis sem backup). A maioria deles são drives USB externos. Em breve estarei ficando sem armazenamento novamente, então estou procurando opções melhores. Minha atual estratégia de backup preguiçoso está em andamento há cerca de 15 anos. Infelizmente, meu principal fator limitante é o custo e não posso simplesmente comprar um conjunto completo de novas unidades mais adequadas para fazer o que for a melhor opção. Só precisando do dobro dos drives toda expansão já é cara.
Assim, estive analisando o RAID 5 e pensando em configurar três armazenamentos RAID 5 usando minhas 9 unidades existentes (principalmente porque apenas 3 unidades têm o mesmo tamanho). Eu usaria a opção de paridade de pools de armazenamento do Windows 10 para isso e me referirei a ela como RAID para simplificar.
Perguntas
1. Li que (obviamente) as unidades USB não são uma boa opção para RAID devido aos limites de taxa de transferência, o que eu entendo. Mas não encontrei em nenhum lugar até que ponto. Eu esperaria uma grande lentidão de leitura/gravação em comparação com uma única unidade? Ou o RAID 5 seria apenas "tão lento" quanto a unidade USB mais lenta do RAID? Ou pode haver uma ligeira aceleração?
2. Não entendo a afirmação que encontro em todos os lugares de que um único URE (erro de leitura irrecuperável), além de uma falha de unidade, pode significar a perda de todo o RAID. Eu encontrei falhas parciais de unidade, mas nunca uma das minhas unidades morreu completamente sem aviso nos últimos 15 anos. Se apenas alguns setores estiverem corrompidos, eu não perderia apenas os dados nas faixas correspondentes a esses setores, em oposição ao RAID inteiro?
3. Supondo que apenas alguns setores falham em uma unidade, como funciona a reconstrução? Tenho que remover completamente a unidade afetada e reconstruir tudo? Ou posso usar uma 4ª unidade fora do RAID, copiar todos os setores não corrompidos para ela e apenas reconstruir os corrompidos, gravando também nessa 4ª unidade? Ainda mais importante, e o caso em que 2 setores em 2 unidades diferentes, mas também em 2 faixas de RAID diferentes, ficam corrompidos? Não vejo por que isso seria uma perda de dados, além do software não ser capaz de lidar com isso. Mas até agora o que li parece sugerir que isso é uma perda de dados. Se for esse o caso, acho que não usarei o RAID, pois isso parece bastante irracional.
4. No meu entender, o maior risco ocorre quando uma unidade falha completamente e eu tenho que ler todos os dados de todas as outras unidades para reconstruí-la. Não ficou claro para mim o quão estressante isso é. Na minha configuração atual, verifico meus dados de vez em quando fazendo o hash de todos os arquivos na unidade de dados e na unidade de backup e comparando-os com uma lista de hashes salvos em outro lugar. Presumo que isso seja tão estressante quanto reconstruir uma unidade RAID?
Obrigado por qualquer ajuda
Não estou familiarizado com Espaços de Armazenamento especificamente, então tentarei manter isso o mais genérico possível.
Mais importante, as unidades USB não serão confiáveis o suficiente. Consulte O que aconteceria quando os dispositivos USB consumissem mais energia do que o hub pode fornecer? . O RAID faz sentido apenas para confiabilidade e qualquer coisa, exceto a conexão permanente, não é confiável o suficiente.
Você teve sorte até agora, mas não deve assumir que isso vai continuar. Falhas repentinas na unidade são uma coisa. Além disso, contra-intuitivamente, as unidades recém-prontas para uso são mais suscetíveis a falhas. Veja curva da banheira .
Não é isso que os controladores RAID (em hardware ou software) costumam fazer. Supõe-se que você tenha backups e falhar muito é melhor do que ignorar silenciosamente o erro, porque não é possível supor erroneamente que está tudo bem. Esse tipo de falha é considerado um caso extremo e você deve considerá-lo em sua avaliação de risco. Se você não estiver pronto para restaurar de backups nesse caso, precisará de mais redundância.
Em condições ideais, copiar setores bons não deve ser diferente de reconstruí-los em condições ideais, exceto que a reconstrução estressa mais o array. Em situações menos que ideais, você estará copiando setores que parecem bons, mas contêm dados corrompidos. Você não é capaz de detectar isso sem comparar com o resto das unidades, que é exatamente o que a reconstrução faz: ela supõe que seus dados provavelmente estão corretos do que na unidade com falha.
Esta é uma situação complicada e não tenho certeza do que aconteceria. Eu testaria isso configurando um pequeno RAID em uma máquina virtual e simulando essa situação corrompendo intencionalmente os dados brutos do disco. Não é um método de teste perfeito porque dados corrompidos != dados ilegíveis, mas se funcionar para corrupção, deve funcionar para setores defeituosos. No Linux, você pode usar dm-integrity + corrupção intencional para simular melhor esse cenário.
Uma reconstrução geralmente incluirá a leitura de todos os setores de todas as unidades, o que é mais desgastante do que a leitura de todos os dados de todas as unidades, como você faz atualmente. O RAID simples e antigo não distingue o espaço usado do espaço livre, porque o sistema de arquivos está em camadas nele. Sistemas de arquivos com RAID integrado, como ZFS e btrfs, distinguem o espaço livre do espaço usado. Eles também têm uma correção de erros mais robusta do que o RAID simples. Eles não são Windows e não sei se existem alternativas nativas do Windows. Existe um driver btrfs de terceiros para Windows , mas não tenho certeza de quão confiável ele é.
O risco adicional durante as reconstruções vem do fato de que o RAID assume que as unidades falham aleatoriamente e não é muito provável que duas unidades falhem em sucessão imediata. Na vida real, nem sempre é esse o caso: falhas de unidades semelhantes tendem a ser correlacionadas, porque têm design semelhante e defeitos ou imperfeições de fabricação semelhantes.
Finalmente, a configuração de qualquer forma de RAID envolve a limpeza das unidades, portanto, você não poderá configurá-lo sem algumas peças sobressalentes.
Se suas unidades USB forem modelos de 3,5", você provavelmente poderá extrair discos rígidos internos vazios que podem ser usados como unidades SATA comuns.
Eu consideraria comprar um NAS e consolidar todo o seu armazenamento em um único dispositivo independente. Com os Synology NAS, você pode até misturar e combinar diferentes tamanhos de unidade em um RAID sem desperdiçar espaço extra nas unidades maiores. É um pouco mágico, mas funciona de forma confiável, tem uma GUI muito boa e não usa nenhuma tecnologia proprietária - se tudo mais falhar, você pode colocar essas unidades em qualquer PC e lê-las inicializando o Ubuntu a partir do USB.