在处理 jpg 或 h264 压缩文件时,像 fdupes 这样的工具是荒谬的。两个具有完全相同文件大小的此类文件已经很好地表明它们是相同的。
比如说,除此之外,如果提取并比较了 16 个 16 字节的等距块并且它们也是相同的,那将有大量证据让我假设它们是相同的。有没有类似的东西?
(顺便说一句,我知道仅文件大小可能是一个相当不可靠的指标,因为可以选择压缩到某些目标大小,例如 1MB 或 1 CD/DVD。如果在许多文件上使用相同的目标大小,这是非常合理的一些不同的文件将具有完全相同的大小。)