关于【duplicate-files】的问题- 第1页

SurpriseDog

Asked: 2019-07-04 09:19:09 +0800 CST

使用 FSlint 仅按文件大小查找重复项？

我正在尝试使用 fslint 来查找重复项，但它需要永远散列整个数 GB 文件。根据这个网站，我可以通过以下功能进行比较：

功能总结

compare by file size
compare by hardlinks
compare by md5 (first 4k of a file)
compare by md5 (entire file)
compare by sha1 (entire file)

但我在 GUI 或手册页中看不到这些选项。我在这里缺少什么吗？

编辑：我使用 jdupes 代替命令行：

jdupes -r -T -T --exclude=size-:300m --nohidden

为了完成这项工作，我必须克隆 git 存储库并从源代码构建。（打包的版本已经过时了。）

我还必须编辑源代码以更改每个：

#define PARTIAL_HASH_SIZE 4096

至

#define PARTIAL_HASH_SIZE 1048576

然后它实际上正确匹配了我的文件。我不知道他们为什么这样编码，但仅匹配前 4096 个字节还远远不够，并且会产生错误的重复项。（也许命令行选项在这里有用）