我在某处(我不记得在哪里)读到将文件压缩成.tar.xz
比.7z
存档更好的整体压缩率,因为存档+压缩格式如 zip、rar 和 7z 单独压缩每个文件,而如果你创建一个 tar 存档然后使用 gzip、bzip2 或 xz 等单文件算法压缩您正在对整个组合数据集运行压缩算法(从而允许您更好地删除多个文件之间共享的数据)。
由于我有一堆包含许多重复文件的文件夹,我需要将它们压缩并存储在某个地方,所以我想知道这个轶事在多大程度上是真实的,以及一般情况下用于这种情况的最佳格式是什么。
我在某处(我不记得在哪里)读到将文件压缩成.tar.xz
比.7z
存档更好的整体压缩率,因为存档+压缩格式如 zip、rar 和 7z 单独压缩每个文件,而如果你创建一个 tar 存档然后使用 gzip、bzip2 或 xz 等单文件算法压缩您正在对整个组合数据集运行压缩算法(从而允许您更好地删除多个文件之间共享的数据)。
由于我有一堆包含许多重复文件的文件夹,我需要将它们压缩并存储在某个地方,所以我想知道这个轶事在多大程度上是真实的,以及一般情况下用于这种情况的最佳格式是什么。
默认情况下,只要您使用该
7z
格式,那么它就是所谓的“固体”存档,而不是简单的一组单独压缩的文件。事实上,如果配置了 7zip(该程序),它可以比诸如 和 others 之类的存档更进一步,
tar.bz
并且可以设置为主动扫描目录以将具有相似扩展名的文件压缩和分组在一起,因为它们更有可能在他们。因此,压缩效果可能略好于tar.bz
因为它只是在找到文件流时将文件流连接起来,并且可能导致文件组不太理想,尤其是在压缩字典很小的情况下。来自为什么新版 7-Zip 创建的 7z 档案可以比旧版 7-Zip 创建的档案大?他们的常见问题解答部分
正如 DanielB 在评论中提到的,您实际上也可以根据您的要求配置实体块大小,恢复为包含单独压缩文件且与压缩数据没有相互依赖性的旧式“非实体”存档,或者您可以将其设置为完全固定或根据您的数据使用各种块大小: