rsync - 使用 shell 脚本将每个 JPG/jpg 文件从一个硬盘驱动器移动到一个目录

Question

roaima

Asked: 2019-11-21 02:16:22 +0800 CST2019-11-21 02:16:22 +0800 CST 2019-11-21 02:16:22 +0800 CST

是否为每个文件重置了 rsync 块压缩字典？

772

是在不rsync -z考虑前一个文件的情况下压缩每个文件的块，还是为每个文件重置压缩字典以便独立处理？

例如，考虑将一个可压缩文件one.txt及其相同副本传输到远程服务器，其中两个文件都不存在：

cp -p one.txt two.txt
rsync -az one.txt two.txt remote:

zlib压缩层是独立处理one.txt和处理的，还是该级别的数据传输只是一个连续的流，所以它two.txt会学习一个有用的压缩字典one.txt，它可以应用于two.txt？

或者，我是否完全误解了zlib压缩算法，以至于（例如）字典总是为每个新块重置？

我试过查看rsync调试输出rsync -avvvvz --debug=IO1,IO2,IO3,IO4 --msgs2stderr，但看不到任何与压缩层特别相关的内容。

_{（这是对我在 ServerFault 上的回答的评论线程的跟进。）}

1 个回答

Voted

Stephen Kitt · Answer 1 · 2019-11-21T02:58:30+08:00

rsync在中使用压缩token.c，并且似乎只存在于那里。tx_strm它在变量中维护 deflate 流状态，并send_deflated_token在前一个标记为 -1 时重置流状态：

        if (last_token == -1) {
                /* initialization */
                if (!init_done) {
                        tx_strm.next_in = NULL;
                        tx_strm.zalloc = NULL;
                        tx_strm.zfree = NULL;
                        if (deflateInit2(&tx_strm, compression_level,
                                         Z_DEFLATED, -15, 8,
                                         Z_DEFAULT_STRATEGY) != Z_OK) {
                                rprintf(FERROR, "compression init failed\n");
                                exit_cleanup(RERR_PROTOCOL);
                        }
                        if ((obuf = new_array(char, OBUF_SIZE)) == NULL)
                                out_of_memory("send_deflated_token");
                        init_done = 1;
                } else
                        deflateReset(&tx_strm);

这从match.c，通过match函数使用，由和hash_search使用match_sums。这些函数始终确保它们在调用last_token设置为 -1 的情况下完成处理，以便下一次调用将重置 deflate 流。所有这些都是逐个文件完成的，因此放气流总是在每个文件的开头重置。

这意味着保证为每个文件重置块压缩字典；它可能会更频繁地重置。

如果rsync要使用以前文件中的数据，则跨文件扩展其哈希处理可能会更有趣。

正如您所建议的，您可以通过同步多个可压缩文件副本来实验性地验证所有这些；统计数据始终显示传输的大小等于单个文件的压缩大小乘以副本数，因此不会跨文件进行一种或另一种重复数据删除。

是否为每个文件重置了 rsync 块压缩字典？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

是否为每个文件重置了 rsync 块压缩字典？

1 个回答

相关问题