Como posso verificar se os arquivos de dados copiados de um disco óptico de dados (como um CD ou DVD) para um disco rígido são idênticos?
Isso pode ser feito facilmente para arquivos de dados copiados de um HDD para outro usando vários gerenciadores de arquivos que são capazes de comparar byte a byte e/ou criar arquivos hash.
Mas como essa mesma tarefa pode ser realizada para arquivos de dados copiados de CD/DVDs para HDDs?
Na minha experiência, dependendo de quanto os CDs/DVDs estão riscados, os bits mudam de uma leitura para a próxima (pelo menos para CDs de música, não sei se isso também é verdade para CDs/DVDs de dados , o que é o tópico desta questão aqui). Então imagino que múltiplas leituras de um arquivo em um CD/DVD riscado resultariam em múltiplas cópias não idênticas do arquivo. Ou existe um código de correção de erros CRC32 ou similar armazenado junto com os arquivos no sistema de arquivos de CD/DVD, evitando assim leituras incorretas de arquivos de dados?
Eu sei que este é um problema para CDs de música (que, novamente, não são o tópico desta questão), porque existem vários programas, como Exact Audio Copy, AccurateRip, etc., que tentam evitar exatamente isso.
Gostaria de saber se o mesmo problema se aplica aos discos de dados e pergunto se existe uma maneira de resolver esse problema.
Como posso ter certeza de que copio com precisão os arquivos do CD/DVD?
nota: estou usando o Windows 10
Não deve haver necessidade de verificar os dados. E não há CRC32 no sistema de arquivos de um CD, mas ECC nos setores de dados de um CD, independentemente do sistema de arquivos. Portanto, não é muito diferente de um disco rígido.
Copiar dados do modo de áudio de um setor de 2.352 bytes é uma arte por si só. Quase não há metadados suficientes para identificar com precisão um único setor de áudio e há dados de correção de erros suficientes para lidar com pequenos arranhões durante a reprodução do fluxo de áudio. Algumas unidades de CD são boas para extrair áudio, as primeiras unidades não, e é por isso que temos uma infinidade de ferramentas de extração de áudio que tentam solucionar os problemas de áudio retornados pelas unidades defeituosas. Os computadores precisam ler o áudio como "blocos" discretos de dados, enquanto o áudio é um "fluxo" constante de dados de áudio, portanto, as primeiras unidades não funcionavam bem quando eram instruídas a retornar um bloco de dados de áudio, e nem todas as unidades. até apoiou.
Mas para setores de modo de dados padrão, os 2.352 bytes são divididos em um cabeçalho de 16 bytes que identifica precisamente o número do setor, depois há 2.048 bytes de dados do usuário e 288 bytes de código de correção de erros.
Portanto, quando a unidade de CD for instruída a ler um setor de dados para fornecer 2.048 bytes de dados do setor, ela usará o cabeçalho para localizá-lo, de modo que não haja erros acidentais ao ler o setor errado, e também usará os dados ECC para corrigir quaisquer erros de leitura e se houver muitos erros e os dados não puderem ser corrigidos ou o ID do setor não puder ser corrigido, você receberá um erro de leitura do setor em vez de dados incorretos.
Ainda assim, se você estiver preocupado, você pode tentar copiar os arquivos do disco para o disco rígido duas vezes e limpar a memória cache para forçar a releitura dos dados do disco, ejetar o disco para fazer com que uma alteração no disco invalide o anterior. dados armazenados em cache já lidos da unidade. Então, comparar os arquivos ou seus hashes deve ser idêntico.
Outro método é tentar usar uma ferramenta de imagem para obter uma imagem ISO. E talvez faça duas vezes e compare os resultados para serem idênticos.