使用 btrfs-send / btrfs-receive 压缩

Question

graffe

Asked: 2020-01-19 13:50:22 +0800 CST2020-01-19 13:50:22 +0800 CST 2020-01-19 13:50:22 +0800 CST

有没有任意大字典的压缩工具？

772

我正在寻找具有任意大字典（和“块大小”）的压缩工具。让我通过例子来解释。

首先让我们创建 32MB 的随机数据，然后将其连接到自身以生成长度为 64MB 的两倍长度的文件。

head -c32M /dev/urandom > test32.bin
cat test32.bin test32.bin > test64.bin

当然test32.bin不可压缩，因为它是随机的，但前半部分与后半部分test64.bin相同，所以它应该可以压缩大约 50%。

首先让我们尝试一些标准工具。test64.bin 的大小正好是 67108864。

压缩包-9。压缩后的大小为 67119133。
bzip2 -9。压缩后的大小为 67409123。（一个非常大的开销！）
xz -7。压缩后的大小为 67112252。
xz -8。压缩大小 33561724。
zstd——超-22。压缩后的大小为 33558039。

我们从中了解到 gzip 和 bzip2 永远无法压缩此文件。但是，使用足够大的字典 xz 和 zstd 可以压缩文件，在这种情况下 zstd 做得最好。

但是，现在尝试：

head -c150M /dev/urandom > test150.bin
cat test150.bin test150.bin > test300.bin

test300.bin 的大小正好是 314572800。让我们在最高设置下再次尝试最好的压缩算法。

xz -9。压缩大小 314588440
zstd——超-22。压缩后尺寸 314580017

在这种情况下，这两种工具都无法压缩文件。

是否有一个工具具有任意大的字典大小以便它可以压缩诸如 test300.bin 之类的文件？

感谢评论和回答，事实证明 zstd 和 xz 都可以做到。但是，您需要 zstd 版本 1.4.x。

zstd --long=28。压缩大小 157306814
xz -9 --lzma2=dict=150MiB。压缩后的大小为 157317764。

1 个回答

Voted

A.B · Answer 1 · 2020-01-20T07:20:14+08:00

Best Answer

A.B

2020-01-20T07:20:14+08:002020-01-20T07:20:14+08:00

它至少可用于xz命令。xz手册页有：

下表总结了预设的功能：
Preset    DictSize    CompCPU     CompMem     DecMem
    -0    256 KiB        0          3 MiB      1 MiB

[...]

    -9     64 MiB        6        674 MiB     65 MiB
栏目说明：

DictSize 是 LZMA2 字典大小。使用大于未压缩文件大小的字典会浪费内存。这就是为什么在没有真正需要时最好避免使用预设 -7 ... -9 的原因。[...]

如自定义压缩器过滤器链部分所述，您可以简单地手动提供字典大小xz，例如--lzma2=dict=150MiB（我们有洞察信息告诉 150MiB 就足够了，否则怀疑必须使用文件大小）。

xz -9 --lzma2=dict=150MiB test300.bin

在执行此xz操作时，amd64 上的进程大部分时间都保持在大约 1.6g 的常驻内存使用量。

$ ls -l test*
-rw-r--r--. 1 user user 157286400 Jan 19 16:03 test150.bin
-rw-r--r--. 1 user user 157317764 Jan 19 16:03 test300.bin.xz

5

有没有任意大字典的压缩工具？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

有没有任意大字典的压缩工具？

1 个回答

相关问题