我们有一个独立的 2008 R2 服务器,在 ESXi 5.5 上运行,为客户端提供文件共享。
昨晚它神秘地停止允许入站共享访问。我假设它正在阻止/删除 SMB,但问题是,我担心的是,没有记录发生的事情。
随着呼叫开始进入,我能够成功 ping 和 RDP 到服务器。同时,\\SERVER\Share
作为域管理员尝试只是在返回共享不可用之前挂起。
一旦我通过 RDP 连接到服务器,一切看起来都很正常:RAM 和 CPU 使用率很低,所有预期的服务都在运行。事件查看器实际上没有显示任何用处,没有错误,只是通常的信息条目和我的 RDP 会话试图映射未知打印机的一些错误。
安全日志,我希望看到大量的“Windows 过滤平台丢弃数据包”,这是我们之前看到的,很清楚,只是通常的登录事件和审计日志。
与其他共享的出站连接很好,简而言之,我看不到任何要修复的东西。
出于绝望,我试图重新启动服务器服务,此时整个盒子冻结了,我不得不按下(虚拟)电源按钮直到它关闭。它恢复正常(感谢上帝)但我很困惑。
我的客户问了一些显而易见的问题,但到目前为止,令人尴尬的是,我无法提供答案。
有什么想法吗?我几乎没有希望回到过去并找到此问题的根本原因,但就此类问题的日志记录或未来测试而言,还有什么可以做的吗?
所以你说你必须手动推动服务器重新启动。事实上相当难。并且所有迹象都表明当您进入 RDP 时系统运行平稳,对吗?但是,系统仍然在一夜之间无缘无故地窒息。
首先,您需要告诉客户有时没有可靠的答案。也许有电涌?也许这只是一个小插曲。我的服务器已经运行了几个月而没有重新启动突然窒息。为什么?不知道。重新启动可以清除一切。有时日志可能会有所帮助。
也就是说,根据您提供的信息,我最好的猜测是存在一些硬件级别的问题。可能是 RAM、硬盘驱动器、相关硬件或其他东西。甚至是 CPU 本身。
在这种情况下,我会做的最好的事情是在某个时间安排一个维护窗口,以便对系统本身进行彻底的硬件检查。如果您不这样做,您将面临此问题可能再次出现或出现完全硬件故障的风险。
这最终被追踪到我们使用的虚拟以太网适配器。它在 E1000 适配器上运行。我把它换成了 VMNet 5 驱动程序,问题就消失了。
FWIW 我们在 ESXi 5.1 上