我有一台运行 esxi 5.1 和 16GB 内存的戴尔 R510;1 个 CPU(Xeon L5520 @ 2.27HGz;4 核)运行单个 Server 2012 机器。我今天早上来这里
核心转储。我按住电源按钮并重新启动。它回到“VMWARE 恢复”屏幕,10 到 20 分钟后,我回来了,它又回到了通常的屏幕(Vmware 信息;IP 地址管理信息等),并且机器上的单个服务器已自行启动备份。问题是,从那以后,它似乎非常缓慢。服务器似乎还可以;性能监视器从来没有达到最大值。似乎最常用的是网络;我只使用了一个 NIC(我们总共有大约 10 个用户访问服务器上的数据文件,它正在运行 DNS、AD 和 DHCP 服务)。我已经更换了一个开关,认为它可能是罪魁祸首,但仍然有相同的结果。偶尔,我与服务器的 RDP 会话会丢失,但最终会恢复。
关于在哪里寻找放缓的罪魁祸首的任何想法?关于我可以尝试提高性能的任何想法?单个 NIC 是否足以支持 10 个用户的文件共享(我们主要使用 Quicken 文件,以及 office xls/word)并不太密集。
我曾经尝试添加另一个 NIC 并“组合”它们,但它破坏了一切,我很难回去改变事情,因为“组合”的 nic 决定使用 dhcp,我无法访问 dhcp 服务器找到地址(因为服务器是 dhcp 服务器)。
感谢您的任何想法。
更新
此后,我已将服务器从网络中移出并将其移至另一个位置。自从它脱网以来,它一直运行良好(nb 在我脱网之前,还有一个与图片中相同的核心转储)。这可能是外部映射 iSCSI 数据存储的结果吗?我在主机上有 2 个错误,vmkernel 日志中有关于它无法登录的错误,但至少有一些错误是已知的:https ://kb.vmware.com/s/article/1031221但不是肯定别人。以下是 vmkernel 错误的几个镜头:https ://imgur.com/a/DOA3umn
此外,这里是 vmkernel.log 中最新的 pastebin。我还可以上传 syslog、usb、vmkeventd、vmksummary、vmkwarning、vprobed 和 vpxa.log 文件。https://pastebin.com/rmp3k1G5
更新 2
我已经让机器在周末运行,到目前为止,它仍然运行良好。没有恐慌,没有崩溃。想知道以某种方式通过 iSCSI 映射为数据存储的外部 NAS 设备可能是cuplrit吗?特别令人担忧,因为我也将它们放在其他几个主机上......
堆栈跟踪以 megasas 结尾,这意味着您的 MegaRAID(您可能有一些 RAID 阵列)的命令可能意外失败,或者是驱动程序错误。我建议将 MegaRAID 固件与 ESXi 驱动程序一起更新(可能还有 ESXi 本身)。ESXi 5.1 很古老,但您仍然可以从 VMware 站点获取更新和异步驱动程序。
我的直觉告诉我存储有问题——这也可以解释由非常高的磁盘延迟引起的迟缓(你应该在 PerfMon 或 Resource Monitor 或 vSphere Client 监控中看到它)。在 megacli/storcli 中检查 RAID 和磁盘状态或重新启动到 WebBIOS 以检查阵列和驱动器状态。
我的第一个猜测是“存储”。
磁盘和卷是如何配置的?正在使用哪种类型的 RAID?
我很确定您有重建或降级的磁盘阵列;这可以解释缓慢。