Tenho dois arquivos, de vários gigabytes de tamanho, que foram compactados com xz
. Suspeito que os arquivos originais antes da compactação sejam idênticos, mas eles foram compactados com xz
opções diferentes, então os arquivos compactados são diferentes.
Como posso verificar se os arquivos são idênticos sem descompactá-los? Como eles são muito grandes, prefiro não descompactá-los se não for preciso.
Eu sei que ele xz
armazena uma soma de verificação CRC, então pensei que seria fácil o suficiente: basta imprimir e comparar as somas de verificação CRC de cada arquivo. No entanto, o comando xz -l
(e xz -l -v
) apenas lista a soma de verificação como tipo "CRC64" em vez do que é a soma de verificação real.
Você está preocupado com o tempo/desempenho de descompactação ou com o armazenamento dos arquivos descompactados?
Você pode evitar armazenar os arquivos usando
e comparar os resultados.
Alternativamente, com verbosidade suficiente (
xz -vvl file1
), você obtém o valor CRC64. Comoxz
permite usar diferentes algoritmos de checksum, é possível que seus arquivos tenham sido criados com algoritmos diferentes, e nesse caso isso não ajudará.Se sua preocupação é sobre o tempo de descompressão, presumo que esperar por uma resposta no StackExchange demore um pouco mais...
xz -lvv
mostrará a soma de verificação do conteúdo naCheckVal
coluna.