我在 HP DL380 G6(使用 Broadcom nics)上安装了 vanilla Windows 2003 SP2(使用 MS Media)。
当我启动未附加到域的机器时,没有问题。一旦我将机器加入另一个 vanilla 域服务器并重新启动,我就开始记录事件 id 1053(“Windows 无法确定用户或计算机名称。()。组策略处理中止。”)记录。其他错误是 DHCP 记录一个它不能租用 IP 并分配默认 169 地址的错误。
但是,一旦机器启动并且我能够登录,机器已经重新检查并租用了它的 DHCP 地址并应用了组策略。我将使用这台机器运行 SQL Server 和 VMWare vCenter,所以我安装了这些应用程序并重新启动。上述错误会阻止 SQL 和 vCenter 在引导时启动。
现在,疯狂的是,如果我在 NIC 恢复它的 DHCP 租约之前禁用/重新启用 NIC 并重新启动,则系统启动时不会出错。如果我在 NIC 正常运行且处于活动状态时重新启动,则会出现错误。
我读过 Broadcom NIC 和 Server 2003 SP2 可能存在问题,但我尝试了这些调整,但它们似乎不起作用。
任何建议将不胜感激。
我会推荐几件事:
确保您拥有 NIC 的最新驱动程序。
在您的交换机端口上启用 portfast。
在注册表中或在适用于服务器的 GPO 中设置“在计算机启动和登录时始终等待网络”设置。
(可选)禁用 TCP 烟囱卸载和接收端缩放。我已经看到这些功能会导致 Broadcom NIC 出现问题。以下链接是一篇详细介绍如何在 W2K8 中执行此操作的文章,但 W2K3 的过程相同。
http://support.microsoft.com/kb/951037
我的猜测是来自服务器的 DHCP 请求在服务器上的网络组件完全初始化之前以及交换机端口进入转发模式之前超时。
您描述的问题似乎表明数据包丢失 - 可能是由于相当低的水平出现问题引起的。因为 DHCP 使用 UDP,它对数据包丢失更加敏感,来自您的服务器的 DHCP 请求或来自 DHCP 服务器的回复可能会丢失或损坏,这将导致您看到的问题。
您与域的交互主要是通过使用 TCP 的协议 - 这具有内置的纠错功能,并且网络堆栈将插入并重试失败的数据包,因此您可能看不到任何明显的故障,但如果您深入研究一下,您可能仍然会看到持续的数据包丢失和一些性能下降 - 从 CMD shell 运行 Netstat -e 以查看它的内容,您不应该在健康的网络上看到任何丢弃或错误,无论如何也看不到任何重要的数字。
我在服务器上使用 Broadcom Gbit NIC 时遇到了很多问题 - 我的标准策略是将它们设置为 1000Mbps 全双工 - 您尝试过的调整是否包括此?