序言:
我有以下设置 -
2 台服务器,包括 Dell Poweredge 2950 上的 Windows 2003 R2、双四核 Xeon、8GB RAM、MD1000 外部 RAID 单元
两台服务器均设置有 5 个网络共享(共享、组、用户和一些未使用的其他)。
两台服务器都安装了 Windows Server 2003 R2 版本的 DFS 来处理故障转移等。这些启用 DFS 的共享的暂存区域位于与共享本身不同的磁盘上。
两台服务器都安装了 SQL Server 2005 Standard。
问题:
在 150 个用户中,我有两个用户在读取或写入网络共享上的文件时出现间歇性死机——他们都是在 Windows Server 2008 系统上作为桌面运行的开发人员(尽管他们在一个月前在 Windows XP Pro 系统上时就存在问题)。
这两个“问题”用户都是开发人员。
公司里没有其他人报告过问题,尽管在各种会议上都被特别问到,而且我自己在公司周围拿着一根稻草杆。
两位开发人员在同一时间点获得相同的减速,并且持续相同的时间。在此期间,其他用户可以访问相同的网络共享而不会出现问题。
除了每个人共享的最后两个跃点之外,两个开发人员都共享相同的服务器网络路径。
两台文件服务器都没有负载,两台服务器通常都处于空闲状态,并且有大量可用 RAM。由于将暂存区从同一个磁盘上移开,因此两台服务器的磁盘队列都符合预期,并且在峰值时不一致。
问题:
任何人都可以建议一种解决此问题的方法吗?我有一种感觉,他们的大部分问题是由于他们使用的开发工具(Slickedit)造成的,但我想消除所有的可能性。
我已经使用各种 Sysinternals 工具监控了服务器,这导致临时区域被移动,但除此之外没有明显的问题。
实际上,如果只有两个用户,我会先查看物理层。交换机或客户端 NIC 是否显示任何错误数据包、抖动等,电缆是否有问题,它们是否可能受到带宽限制?
其次,如果它相当容易重现,我会在机器上转储一个数据包嗅探器(使用镜像端口或透明嗅探器),看看在协议级别是否有任何明显的东西。
他们有两个网卡吗?我在安装两个网卡时看到了这种情况,但在我的情况下,它似乎与 AVG 防病毒有关,因为如果我卸载 AVG,问题就会消失。
JR
可能与 Server2k8 机器上的 SMB 2.0 有关。
http://en.wikipedia.org/wiki/Server_Message_Block