我们在使用 Oracle VM 平台托管大约 10 多个虚拟机的物理服务器上出现 UPS 错误并断电。我们让它恢复运行,但我想知道从中恢复的最佳方法是什么。具体来说,我想知道我们是否需要在每个单独的 VM 上运行 fsck,和/或我们是否应该在平台级别运行 fsck?我们的系统管理员最近辞职了,我更像是一名程序员而不是系统管理员,所以这有点超出我的能力。我一直在查看 OVM 文档(OVM Manager 3.2.1),但似乎找不到任何关于处理这种情况的具体内容。我很感激任何能给我指明正确方向的人。
理想情况下,您应该
fsck
每个 VM 的文件系统。您应该在单用户模式下运行 VM,或者从网络或 CD 映像引导来执行此操作。如果要在单用户模式下启动 VM,请执行以下操作:找到虚拟机的配置文件。我通常使用 grep 获取 VM 名称:
使用 Xen 工具手动启动 VM,而不是从 OVM Manager 启动,连接到控制台:
出现
GRUB
菜单时,编辑引导选项。你还没有说你的虚拟机正在运行什么发行版,但假设一些类似 RHEL(RHEL、CentOS、OEL)的东西,我会删除选项rhgb
并quiet
添加single console=xvc0
. 该single
选项告诉 init 启动单用户,console=xvc0
告诉内核xvc0
用作控制台设备。这是 Xen 控制台,您可以通过 Oracle VM Manager 访问它。一旦你启动到单用户,你就可以
fsck
文件系统。但是,您不应尝试 fsck 根文件系统或任何其他已挂载的文件系统。只要卸载了用户/数据文件系统,就可以安全地对其进行检查。不过,您可以运行fsck -n
以检查根文件系统是否存在错误。如果这确实报告了错误,您应该网络引导或 CD 引导 VM 并fsck
从那里运行,这样文件系统就不会被挂载。