一些背景。
我正在使用ZREP相互复制两台服务器,每台服务器都包含一个 ZFS 池,其中包含两个数据集作为复制主机和两组作为复制目标。主集包含本地服务器的系统和 VirtualBox-VM,复制目标与另一个相同。
此外,我正在将每台服务器的所有主集备份到使用rsync
. NAS 非常慢,备份需要几个小时才能成功,因此实施的方法是暂停 VM,创建一个快照,还原 VM,rsync
然后从创建的快照运行。重要的是手动创建的快照没有遵循 ZREP 命名约定,rsync
再次完成后直接销毁。起初,ZREP 继续并行运行,由cron
.
问题。
但时不时会发生 ZREP 进入某种无法再同步的状态。为了解决这个问题,一位同事告诉我他需要删除快照并按照流程重新初始化 ZREP。通过最终不再让 ZREPrsync
与我们自己的快照并行运行,这个问题得到了解决。
遗憾的是,我缺乏该错误的具体细节,并且该同事不再可用,但从他的描述看来,在复制主机和目标之间找到快照的共同祖先以增量同步时存在问题。我认为错误消息类似于以下内容:
cannot receive incremental stream: most recent snapshot of zfs-pool/vbox/tori does not match incremental source
cannot open 'zfs-pool/vbox/tori@zrep_0001b7': dataset does not exist
我对增量发送/接收如何工作的理解。
根据我对文档和其他 问题的理解,要成功地增量发送快照,发送主机和接收目标需要共享一个用作参数 1 的快照,zfs send
并且该快照还需要是接收目标上的当前快照。
第二个参数是一个任意较新的快照,ZFS 使用它来计算一个快照主节点和目标快照的共同差异,并将这些差异发送到复制目标。因为两者共享同一个指定为参数 1 的快照,所以差异对目标有意义并且可以简单地按原样应用。
根据我的理解,这些论点-i
要么-I
导致发送一个包含主端计算的所有增量数据的逻辑快照,要么发送包含其增量更改的所有中间快照。因此,例如-i
,总是会导致目标上的一个新快照,而-I
可能会导致 N 个额外的快照。
在作为 arg 1 和 2 提供的内容之间创建和销毁中间快照zfs send -i
应该没有任何问题,因为 ZFS 总是只计算这两个提供的参数之间的差异,而不关心任何其他中间快照。在 ZREP 的情况下,这在理论上意味着只要我不干扰 ZREP 管理的快照,无论是否在其操作期间创建了额外的快照,它都不应该有任何区别。仅仅因为特殊的 ZREP 快照始终可用,由 ZREP 管理并用于计算复制差异。所以理论上,另外创建快照rsync
和备份应该不是问题。
这些假设正确吗?
非 ZREP 相关问题。
一般而言,忽略一些中间快照以递增方式发送 ZFS 快照是否安全?或者是否有必要将曾经创建的所有中间快照发送到复制目标以使网络不同步或其他东西?事物如何依赖于-i
vs. -I
?
https://www.reddit.com/r/zfs/comments/cfzdb3/is_it_safe_to_send_zfssnapshots_incrementally/euensuy/