问题:
在内存不足的情况下,节点开始显示为无响应,但大多数虚拟机实际上都在工作,甚至可以从 ovirt-engine 访问,但有些虚拟机显示为 UP,但实际上已关闭。
我决定隔离一个失败的节点并重新启动它。我在 UI 中按下“重新启动”,然后继续重新启动节点。在它出现后,它仍然处于非响应状态,并且在此主机上运行的虚拟机处于“未知”状态。
当我单击“确认主机已重新启动”时,出现以下错误:“另一个电源管理操作已在进行中。”,由于“无响应状态”和“此节点已运行”,将其置于维护状态不佳vm 的”消息。
如何手动隔离主机并让我的虚拟机在其他工作主机上运行?
环境:
- oVirt 节点 4.3.5.2
- Ovirt 引擎:4.3.5.5-1.el7
重新启动管理引擎解决了这个问题,我实际上能够使用“确认主机已重新启动”。
如https://www.ovirt.org/documentation/self-hosted/chap-Troubleshooting.html中所述,在同一节点上重新启动托管引擎所需的步骤,同时连接到运行引擎的节点:
设置全局维护模式
关闭托管引擎 vm:
启动时再次启动 VM:
完成这些步骤后,引擎 UI 中的“确认主机已重新启动”开始工作