我在运行 ESXi 6.0 的服务器上遇到了严重问题,上周一切正常。现在整个事情基本上没用了。我的数据存储延迟高达 51 秒!从现在到上周,除了在 VM 上安装一些软件外,没有任何变化。
该服务器是 HP Proliant DL360 G7 2X hexacore Xeon X5650 2.67GHz 144 GB RAM。RAID 10 中的 8 个 300GB HP 10k SAS 硬盘。
我的机器上有 6 个虚拟机,大多数都使用精简配置的 VMDK 超出 1.6 TB 我有 600GB 空闲空间。
2 个虚拟机似乎运行良好,其他的运行起来完全是废话。
我已经尝试重新启动服务器。将更多资源分配给速度较慢的虚拟机(即使它们有很多),但没有任何效果。
即使每个虚拟机都关闭了电源,我也尝试将虚拟机从服务器上移到网络上的存储设备上,并且我的数据传输出现了峰值。它将以 20 -30MB / s 的速度移动大约 20 秒,然后在几分钟内下降到接近 0 的速度,然后以恒定模式恢复,这表明某处存在瓶颈。
当我尝试在开机的 VM 中的虚拟驱动器之间移动数据时,也会发生同样的事情。现在我正在尝试传输一个文件,它的速度约为 200kb/s。在慢速虚拟机上,启动需要 20 多分钟,而且速度太慢,您无法使用它。
我完全不知所措。我非常感谢解决此问题的任何帮助。
我建议您的问题与RAID 控制器的缓存和电池/闪存模块的健康状况有关。例如,如果由于 RAID 电池故障而禁用了 RAID 写入缓存,您在阵列上的写入性能将严重下降。
有几种方法可以检查这一点。您能否指定这是独立主机还是 vCenter 管理的集群的一部分?
编辑:
此主机似乎未安装 HP 特定版本的 ESXi。
如果没有此功能或适用于 ESXi 的 HP 插件,则无法监控主机硬件或检查系统状态所需的任何实用程序。
通常,您可以像这样以图形方式查看状态:
考虑到 G7 生产线于 2011 年推出,并且电池的生产寿命通常为 3-5 年,我怀疑您的蓄电池出现故障。如果这是一台使用过的服务器,这可能是原因。您应该从这里、这里和这里添加它们。
在命令行中,运行以下命令将显示您的电池状态(其他方便的命令):
输出:
如果部件坏了,我们可以使用以下方法强制它忽略电池状态(如果您的设备没有稳定的电源,会有风险):
这至少会在您安排零件维修/更换时恢复性能。