Eu li que o ZFS/BtrFS tem uma verificação de soma de verificação, mas eles não a usam para recuperação de dados, apenas para recuperar dados de uma cópia local completa ou de uma cópia espelhada.
Por outro lado, os arquivos RAR suportam redundância de dados por muito tempo, com quantidade configurável. Quanto maior o valor, maior é a probabilidade de uma recuperação bem-sucedida. O mesmo vale para o Dvdisaster, que é capaz de criar arquivos .ecc com dados de recuperação, mas em uma mídia separada.
Muitas mídias avançadas, como discos ópticos ou discos rígidos, possuem uma verificação ECC de baixo nível implementada em um controlador de unidade, portanto não é tão necessária em níveis mais altos de abstração. Mas outros, como cartões microSD baratos, podem não ter esse recurso e são perceptivelmente não confiáveis.
Portanto, há verificações de ECC no nível de hardware e no nível de aplicativo, mas há algum sistema de arquivos apoiado por ECC?
O Linux possui a camada dm-integrity com a qual você pode adicionar correção de erros a qualquer dispositivo de bloco.
Infelizmente, será relativamente ruim resolver os problemas que os cartões SD não confiáveis representam:
O modo de falha mais típico é... simplesmente não funcionar mais. Isso normalmente acontece quando a quantidade de nivelamento de desgaste que a memória fisicamente disponível foi capaz de sustentar se esgota. Não há nada que você possa fazer a respeito, a não ser escrever e ler menos. Adicionar informações de codificação de erros é, contra-intuitivamente, prejudicial, porque você amplifica a quantidade de dados que escreve e lê. Mas isso é apenas uma amplificação de 1/r, sendo r a taxa do código.
Depois que o cartão SD aplica sua correção de erros integrada, os dados que você lê estão corretos ou os erros são locais de bloco e correlacionados. Se precisar corrigi-los, você terá que usar um código cujos blocos abrangem vários blocos lógicos do cartão SD. Novamente, isso significa uma amplificação de leitura e gravação, mas desta vez por um fator inteiro de pelo menos dois. Então, isso é significativamente pior.
Portanto, com toda a honestidade, se o seu problema for o armazenamento flash não confiável, a resposta apropriada é lidar com isso entre o flash físico e o ponto onde as coisas aparecem como blocos de memória no seu sistema de armazenamento. Em outras palavras, na camada de tradução flash do cartão SD; isso também permitiria aplicar decodificação suave para ganho de codificação adicional e poderia usar códigos projetados para o canal assimétrico (normalmente: um canal Z!!) que a memória flash representa, no nível mais baixo - essas são propriedades perdidas durante a decodificação /decisão e desintercalação acontecendo no próprio FTL. Essa perda será difícil de compensar com os dados obtidos do cartão SD.
Você escolheria diretamente um código que atendesse aos seus requisitos de confiabilidade. O problema com isso é que quanto pior for a memória flash física e quanto mais confiável você deseja que o armazenamento se comporte, menor será a taxa de código, o que significa que você precisará de mais células flash para um pouco de dados. Essa é exatamente a compensação que torna qualquer dispositivo de armazenamento baseado em flash barato e menos confiável ou caro e mais confiável.
Portanto, com cartões SD não confiáveis, você basicamente perdeu. Pode haver uma janela em que um pouco de codificação em seu PC possa corrigir erros sem tornar os erros mais prováveis do que isso evita, mas você realmente precisaria realizar um grande estudo sobre quanto tempo leva para fazer seu cartão SD falhar antes que você pudesse estabeleça uma taxa para isso. O que não vale a pena - você não está comprando 100.000 cartões da mesma fábrica apenas para descobrir como torná-los 0,1% mais confiáveis. Você apenas compraria ou solicitaria cartões mais confiáveis.
Desculpe.
O que você poderia fazer é adicionar redundância verdadeira usando placas independentes em um esquema de paridade ou espelhamento de balanceamento de dados, mas as advertências usuais para qualquer tipo de RAID se aplicam: você precisa ter certeza de que no momento em que precisar restaurar um dos subjacentes volumes dos outros, não é tarde demais e a intensa carga de leitura de recuperação revela ou até causa erros adicionais, infelizmente incorrigíveis. Novamente, cartões SD baratos são a pior escolha comercialmente disponível para isso, porque a qualidade das informações sobre confiabilidade é baixa, assim como a confiabilidade de seus dispositivos individuais.
Concluindo, não vejo realmente um cenário prático em que você queira criar armazenamento confiável com cartões SD não confiáveis.
Sim, eles são chamados, coletivamente, de "RAID": Redundant Array of Independent Disks.
O melhor que existe para configurações NÃO-RAID inclui EXT4 no Linux. Acredito que existam outros. Mas isso não os corrige, mas sim detecta erros ao escrever, acredito.