Estou tentando determinar se há algum problema potencial usando bzip2
para compactar arquivos que precisam ser 100% reproduzíveis. Especificamente: os metadados (nome/inode, data do último mod, etc) ou qualquer outra coisa podem fazer com que conteúdos de arquivos idênticos produzam uma soma de verificação diferente no arquivo resultante .bz2
?
Como exemplo, gzip não é determinístico por padrão , a menos que -n
seja usado.
Meus testes brutos até agora sugerem que o bzip2 de fato produz consistentemente arquivos idênticos com dados de entrada idênticos (independentemente de metadados, plataforma, sistema de arquivos etc.), mas seria bom ter mais do que evidências anedóticas.