为一个让我束手无策的问题寻求帮助——我已经解决了好几天的问题,但无法弄清楚。
突然之间,几天前,将文件从我们的一些 Windows XP SP3 x86 工作站复制到一个特定的 Windows 2008 R1 x64 服务器变得超级慢——想想 7 分钟传输一个 10MB 的文件。问题只是工作站->服务器,在另一个方向复制工作正常。
将文件复制到同一台服务器(和同一文件共享)几个月前一直很好,据我所知,服务器、工作站、组策略等没有任何改变。工作站是物理机,服务器是在 ESX 3.5 中运行的 VM,一切都通过千兆 LAN 连接,并且都加入了同一个(Windows 2008 功能级别)域。
工作站或服务器上都没有明显的问题 - 没有 CPU/内存/磁盘问题或尖峰,没有事件日志条目,没有明显的 DNS 或 Active Directory 问题等。此外,除了这个特定问题,工作站和服务器的行为完全正常(包括网络复制到其他服务器/共享)。
通过一些故障排除,我确定问题只发生在我们的一些工作站上——特别是我们 IT 部门使用的三台机器。这确实意味着组策略和应用程序集略有不同,但正如我上面提到的,问题开始时应该没有任何改变,并且这些机器上都没有安装任何会影响网络或文件共享的异常。
这个问题的另一个不寻常的方面是它以前发生过一次 - 涉及完全相同的工作站和不同的服务器,但在这两种情况下问题服务器几乎相同 - Windows 2008 x64 VM,运行 IIS7 作为他们的 /only/ 应用程序,正在使用作为我们的开发网络服务器。上一轮我们只是对服务器进行了核对(并用这次有问题的服务器替换了它),直到现在都解决了问题,但鉴于问题反复出现,我想找到它的根源。
到目前为止,这是我尝试过的,但都无济于事:
- 重新启动:-)
- 禁用防病毒和防火墙。
- 关闭服务器上所有可能的服务。
- 在服务器上重新安装 VMware Tools。
- 更新了工作站上的网络驱动程序。
- 使用不同的用户帐户 - 它是特定于机器的,而不是特定于用户的。
- 在服务器上创建了新的共享文件夹/共享。
- 使用了几种不同的复制方法 - Explorer、TeraCopy 和 xcopy。
- 使用 IP、NetBIOS 名称和 FQDN 映射共享。
- 刷新 DNS 和 ARP 缓存。
- 强制 DNS 重新注册。
- 摆弄网卡属性(链接速度、流量控制、TOE 和 TSO 选项、MTU 等)。
- 在服务器上卸载了 IIS7(认为这是我们遇到问题的两台服务器之间的共同点)。
- 可能还有一些我现在忘记的东西......
我还尝试使用 WireShark 捕获网络跟踪。我对分析这些不太了解,但我确实将“正常”副本的跟踪与“超慢”副本的跟踪进行了比较,主要区别似乎是很多相当长的停顿(通常 ~0.3秒)在一系列以“[TCP Retransmission]”、“[TCP Dup ACK...”、“[TCP Fast Retransmission]”和“[TCP Out-Of-Order]”开头的错误条目之前。不确定这是否有帮助。
所以 - 有人有什么好主意吗?我不知道可能出了什么问题或如何解决它:-S