我在县政府担任 IT 专业人员超过 2 1/2 年,此问题已发生 3 次。我可以通过重新启动主服务器来修复它,但我想修复它而不必走那条路。情况是这样的。在我们的主服务器(从这里开始称为 Server1)上,我们运行着名为 Springbrook(基金会计和公用事业计费企业软件)的软件。用户通过映射到 Server1 的驱动器访问 Springbrook。我在他们的桌面上放置了从映射驱动器中提取软件的快捷方式。有时,我不知道为什么,有 3 个或更多用户无法访问 Server1,这导致他们无法访问 Springbrook。我们其他人仍然可以访问 Server1。失去对 Server1 的访问权限是指 PC A 无法 ping、RD 或访问 Server1 上的共享。Ping 告诉我远程主机无法访问,RD 给出相同的消息,当我尝试浏览映射的驱动器时,该消息告诉我网络路径不可用。如果我重新启动 Server1,那么这 3 个用户突然可以再次访问 Server1。
我假设唯一发生的事情是网络服务正在重新启动,但我不知道它是 NetLogon 服务、AD 服务,还是我不知道的其他东西。重新启动用户的 PC 并不能解决问题。将 PC 重新加入域也不能解决问题;它总是重新启动 Server1 来解决问题。
这种情况并不经常发生。就像我说的,在我来这里的 2 1/2 年里,它发生了 3 次。在这 3 次中,它也不是同一台 PC。我想知道如何防止它或至少如何在不完全重新启动服务器的情况下修复它。
广告域。Windows Server 2008 R2 服务器。Sonicwall TZ210 防火墙。Netgear 24 端口千兆交换机。PC 连接到 Netgear gig 5 端口交换机。
谢谢。
编辑:感谢您到目前为止的回答。我的问题写得不好。我没有提到受影响的 PC 可以与网络上的其他 PC 通信,甚至是 Server2(我们必须与 DC)通信。Server1 也无法 ping 到受影响的 PC。
我找到了问题的答案!无论如何今年。:)
这个问题在昨天早上和午餐时再次出现,但这次只是上周受影响组中没有的一台 PC。在问题期间我做了以下事情:
午餐时,怪物再次抬起丑陋的脑袋。
前往服务器,收集受影响的 PC 和服务器之间的 wireshark 数据包。然后,我重新启动了服务器,因为我知道这可行。这解决了问题。我只能花几分钟时间阅读收集到的数据,因为出现了其他问题(我是唯一的 IT 专业人员 - 一名男工作人员)占用了我剩下的轮班时间。想了一个晚上。今天早上来,收集网络流量只是为了看看是否有任何网络进程占用,但找不到任何使“管道”膨胀的东西。然后它击中了我:检查服务器上的卡巴斯基日志。我检查了网络攻击拦截器日志,发现上周卡巴斯基检测到来自上周和昨天受影响机器的 3 台受影响机器的 dos.generic.synflood“攻击”。当卡巴斯基检测到这样的事情时,它将切断与攻击节点的通信 60 分钟。日志给出了问题的确切时间,并且时间与受影响的用户就该问题打电话给我的时间相匹配。我回溯了 30 天的日志,发现这些日志没有受到攻击。
我将网络攻击拦截器设置为仅拦截攻击节点 1 分钟。我还将调查 synflood 攻击可能是什么。至少现在我知道为什么那些机器与服务器断开连接了。当然现在,我需要找出那些 dos.generic.synflood 攻击的来源。
如果您无法 ping 服务器,则表明它已断开网络连接,重新启动任何 Windows 服务都无法解决任何问题。您要么是网络本身有问题,要么是服务器的网卡有问题。
鉴于它只是一些机器,而且听起来您的网络并不是内部路由的,您的其中一台交换机可能出现故障或出现 ARP 问题。听起来他们没有被管理,所以下次发生时,您将不得不在问题发生时进行一些故障排除以找到故障。
我不得不同意 Mfinni 的观点,重新启动任何提到的服务,将不允许/停止访问您的服务器的流量。如果有的话,请检查您的服务器是否有任何防火墙配置。不幸的是,这个问题是间歇性的,你将要玩一个等待游戏来解决问题。您能做的最好的事情就是确定再次发生时的行动计划。为此,我会首先在服务器和客户端上运行 Wireshark 或其他类型的数据包嗅探器,同时问题正在发生,并且您从受影响的机器上不断发出 ping 信号。我还会检查那些受影响的机器是否可以与本地/删除子网上的任何其他机器通信以缩小您的问题范围。
您是否尝试禁用然后重新启用 Server1 上的网卡?
大约一年前我遇到了类似的问题,我的文件服务器无法识别其中一个客户端。我做了以下事情:
确保在 Server1 或 PC 无法访问的任何一台上执行此操作。
让我知道是否有帮助。