我在 Ubuntu 下有一个长期运行的 ZFS 池,它已经经历了多次升级。从 Ubuntu 20 升级到 22 后,加密的文件系统拒绝挂载,但其余的似乎都正常。 在加密文件系统的根部zpool status -v
报告永久错误ZFS-8000-8A 。我注意到 zfsutils-linux 的软件包版本从 0.8.3 到 2.1.5 有一个很大的跳跃。
该池仍然可以导入到 Ubuntu 20 系统,并且加密的文件系统仍然可以安装在那里。看起来还不错。更重要的是,我可以zfs send
在 Ubuntu 20 和zfs receive
Ubuntu 22 上进行操作,并取得了明显的成功。
如果我将zfs send
整个池(或部分操作)从 Ubuntu 20 (ZFS 0.8.3) 升级到 Ubuntu 22 (ZFS 2.1.5) 并且操作成功,我是否会创建一个没有升级问题的池?也就是说,接收操作是否会构建一个与 ZFS 完全同步的池?或者链接是否会出现兼容性问题?
我对 zfs 发送/接收操作的级别了解不够,无法确保在 Ubuntu 22 下不会出现进一步的损坏。
如果有必要,我很乐意重新加密加密的文件系统,而不是发送原始文件。一切都将在本地发生。在本例中,Ubuntu 20 在连接了磁盘设备的 LXD VM 中运行,并且发送/接收管道不跨越任何网络。
请注意,我知道废弃整个池并从备份中恢复它的建议。我正在尝试恢复而不必诉诸于此,因为我似乎能够读取池。
所有磁盘都通过了长时间的 SMART 测试,并且在 Ubuntu 20 下清理池没有显示任何错误。
我很高兴被告知(带有引用)该错误仅限于加密文件系统,我可以替换它们并继续,而无需重建整个池,但我对 ZFS 内部结构了解不够,无法确定那。我很想知道如何找到答案。
首先,虽然从 0.8.3 到 2.1.5 的升级肯定是一个大升级,但它不应该以(部分)损坏的池结束。所以我建议打开一个 GitHub 问题(或写信到 zfs-discuss 邮件列表)。
--raw
也就是说,在没有或选项的情况下发送池--compress
肯定是获取所有数据的好策略:完整zfs send
与逻辑上遍历整个池非常相似,例如rsync
(在记录大小处理方面存在重要差异,但对于关于加密)。如果失败,您可以
rsync
在两个池/数据集之间使用简单的方法。我已经解决了这个问题,并在 zfs-discuss 邮件列表上发布了详细信息。我会将信息发布在这里,以防对其他人有帮助。我的解决方案确实涉及长时间的服务器停机。Ubuntu bug #1987190中提供了一些补丁,如果您不能容忍这种情况,它们可能会工作得更好。
我在 GitHub 上发现了几个与我的问题相关的 ZFS 问题:
升级后安装加密 fs 时出现 I/O 错误
无法安装文件系统:输入/输出错误
通过清理清理在以下文件中检测到永久性错误,没有其他错误
该错误与使用旧 ZFS 版本的本机加密创建的文件系统中的元数据有关。
我是这样修复水池的:
使用新的 ZFS 池在外部驱动器上安装 Ubuntu 22,并在该驱动器上启动服务器。
在该系统的 VM 中运行 Ubuntu 20,并将服务器的池成员磁盘附加到该 VM。
将旧池导入到虚拟机中。
在虚拟机中挂载“损坏的”文件系统。
zfs 从 VM 中的旧池发送到主机系统中新池中的 zfs 接收。这修复了元数据。
检查、再检查、确认所有数据均已完成。(我在 .zfs/snapshot 中的关键快照上使用了 rsync -n --checksum。)
扩展 SMART 测试并对旧池进行全面擦洗。
将服务器启动回 Ubuntu 22。无需回滚。
从外部磁盘导入新的 ZFS 池。
销毁损坏的文件系统。
zfs 从新池发送到旧池,重新创建损坏的文件系统。
我这样做是因为我对旧水池的完整性感到怀疑,并且不想过多地碰它。事实上,我认为我可以继续在 Ubuntu 22 的旧池上运行服务器,并在服务器上启动 Ubuntu 20 VM。但是,如果操作系统本身的文件系统损坏,这当然会失败。
我希望这可以帮助其他人解决这个问题。