我有一个 RAID 中有 4 个驱动器的 Dell Poweredge R630。我不确定它是 RAID 10 还是 RAID 5,因为我最初没有订购或设置服务器,而且我只是默认的网络管理员,这不是我的主要工作。该服务器运行 vSphere Essentials ESXi 6.7,并托管了六台虚拟机。
我使用在另一台主机上的 VM 中运行的 Altaro VM 备份来备份该主机以及 ESXi 6.5 主机。当我开始备份这台主机上的虚拟机时,我发现备份会随机失败。我正在备份的 5 个虚拟机中的任何一个晚上 2 或 3 个都会失败,但每晚的虚拟机都不相同。几周前,他们开始总是失败。
在与 Altaro 支持人员合作以找出失败的原因时,他们在 Altaro 日志中发现了这一点:
2019/09/24 00:11:31.034: DISKLIB-LINK : "san://snapshot-155[Storage] VMName/[email protected]:[email protected]/XXX" : failed to open (Unknown error).
2019/09/24 00:11:31.034: DISKLIB-CHAIN : "san://snapshot-155[Storage] VMName/[email protected]:[email protected]/XXX" : failed to open (Unknown error).
2019/09/24 00:13:18.446: VixDiskLib: Detected DiskLib error 2338 (NBD_ERR_NETWORK_CONNECT).
2019/09/24 00:13:18.446: VixDiskLib: VixDiskLib_Read: Read 437 sectors at 19619760 failed. Error 14009 (The server refused connection) (DiskLib error 2338: NBD_ERR_NETWORK_CONNECT) at 5235.
他们的支持说这些日志条目,我假设特别是最后一行,直接来自主机。
不是 ESXi 专家我不完全确定要在 ESXi 中查看哪些日志文件以尝试找出问题所在,确认这是主机上的驱动器问题,并确定它是哪个驱动器以便我可以更换它。到目前为止,vCenter 没有发出任何有关驱动器问题的警报或警告,主机也没有指示阵列存在问题。
另一个数据点:这些虚拟机中的大多数都运行 Windows。其中每一个都在内部运行 Windows 备份到一个单独的驱动器,并且所有这些都完成且没有错误。我发现有趣的是,Windows 能够从 VM 内部备份其驱动器,但是当 ESXi 从外部进行备份时出现读取错误。