Aqui está um cenário que eu tentaria evitar:
- Hoje é 11 de novembro de 2024. Está tudo bem com o SSD do meu Mac (espero...). Faço um backup do Mac para um NAS.
- O tempo passa...
- Agora, "hoje" é 1º de junho de 2025. Eu faço um novo backup do Mac para um NAS. Mas o que eu não sabia é que o mesmo arquivo no Mac foi corrompido por causa da degradação desde então, e agora a versão corrompida do SSD do Mac substituiu a versão "OK" em um NAS. A versão "OK" foi perdida e agora eu tenho duas cópias de uma versão corrompida.
- https://en.wikipedia.org/wiki/Data_degradation
É possível prevenir tal cenário? Qual deve ser o fluxo de trabalho?
O sistema também não sabe que os dados estão corrompidos. Infelizmente, o APFS da Apple não mantém somas de verificação de dados (seu NAS provavelmente usa ZFS ou Btrfs, que fazem isso). Então você precisa mantê-los por conta própria – encontre uma ferramenta que gere sha1sum ou xxhash para todas as fotos em um arquivo; configure-a para funcionar incrementalmente (ou seja, gere hashes para novos arquivos, mas nunca os gere novamente para arquivos "conhecidos"); então verifique esses hashes antes do backup e gere novos hashes onde quer que você importe fotos.
Não use "copie e cole a pasta inteira uma vez por trimestre" como seu sistema de backup. Existem vários sistemas de backup "desduplicados" (por exemplo, Borg, Restic) que funcionam de forma semelhante ao Git, mantendo muitos instantâneos ao longo do tempo, onde dados idênticos são armazenados apenas uma vez. (O Time Machine da Apple é semelhante , mas não acho que atenda aos requisitos.)
Como a desduplicação em tais ferramentas é baseada em hashes de dados armazenados, não em nomes de arquivos, isso também significa que dados não idênticos (por exemplo, arquivos corrompidos repentinamente) serão armazenados separadamente e nunca substituirão uma versão diferente armazenada anteriormente, o que significa que você não precisa comprometer a frequência de backup - por exemplo, mesmo se você executar a tarefa de backup todos os dias, ter esses instantâneos antigos ainda lhe dará várias semanas ou meses para executar novamente as verificações manuais sha1/hash mencionadas anteriormente e perceber a corrupção.