tar 目录只发送修改过的文件块

Question

Basj

Asked: 2020-02-04 12:02:47 +0800 CST2020-02-04 12:02:47 +0800 CST 2020-02-04 12:02:47 +0800 CST

rsync 在这个简单的例子中是如何工作的？

比方说：

感谢这个答案，我发现rsync能够计算这两个文件之间的“二进制差异补丁”：

rsync --only-write-batch=patch b a

在这个例子中，patch文件是......只有 65 KB，所以非常好。

总之，rsyncdetect这么少的byes怎么改的？我最初认为它会比较：

对于各种 k 值，例如 2 可能的最大幂 (2^j)，如果不匹配，则为 2^(j-1)，然后为 2^(j-2)，等等。

但是对于这些文件a和b，它会完全失败，因为因为b只是a移动了一个字节，所以根本不会有类似的块！然后我们会期望patch是... 256 MB。

但是在这里它以一种更聪明的方式工作，在这个简单的例子中算法是如何工作的b=一个字节与内容的连接a？

Basj · Answer 1 · 2020-02-04T13:22:39+08:00

Best Answer

Basj

也许更了解这一点的人可以发布另一个答案，但经过进一步研究，rsync 算法的关键似乎在“确定文件的哪些部分已更改”段落中有详细说明：滚动哈希。

与：