我们最近为一对 Dell PowerConnect 6248 堆栈更换了 Cisco 6500 核心交换机。从那时起,我们在 ESX 集群上的两台虚拟机上运行的网络负载平衡共享点一直表现不佳。症状是打开和保存存储在 sharepoint 中的文档需要很长时间。Sharepoint 服务器或 SQL 服务器上没有显示任何错误,只是很多恼火的用户。最初我认为 NLB 不可能导致这种情况,但是一旦我们将 Intranet 的 DNS 记录重新指向其中一个 Web 前端的 IP 地址,问题就消失了。
我们怀疑戴尔配置中存在与多播相关的问题 - NLB 配置为多播,但不是 IGMP。
有没有人对我们进行了类似的设置并解决了此类问题?VMware ESX 上的 Sharepoint,带有 Dell PowerConnect 交换机。
我们已经看到了几乎相同的问题。我们使用 NLB 和多播(但不是 IGMP)在插入一对堆叠 Dell PowerConnect6248 的两台 ESX 4 服务器上对 14 台 Web 服务器进行负载平衡。nlb 正在工作,但表现很糟糕。我们尝试在 nlb(单播、多播、igmp)和 vmware 交换机(promicous、nitify 交换机等)上更改所有内容,但无法使其正常工作。我们向戴尔网桥和 arp 表添加了多播 MAC,但均无效。我们最终通过关闭 PowerConnect 上的 VLAN 路由(即使用简单的第 2 层 VLAN)并使用外部路由器路由流量来解决此问题。很想知道如何使用戴尔上的路由来完成这项工作,因为它应该得到支持。
一切听起来都很熟悉。我有完全相同的问题。Exchange 上的 NLB 和一组 ESX VM 上的 Sharepoint,只要 NLB 有流量,它就会停止。我们与戴尔密切合作,问题是多播。据说有一个戴尔白皮书,上面说你必须使用单播而不是多播。
现在我们正在等待将 NLB 转移到单播。我们有 30 多个这样的交换机,现在都运行 3.2.0.7。v3 固件是一个很大的改进,但如果您从 v2 升级并确保您阅读了他们的说明,请小心,这不是简单的安装和重启。此外,有些东西以不同的方式配置,例如 DHCP 中继。它从一开始就严重破坏了我们的 NLB。
如果您不相信,请尝试 ping 管理界面(类似于 PingPlotter 的图形),同时监控到 NLB 的流量。您会看到 ping 时间与流量有关。我们从 1 毫秒的 ping 到超过 200 毫秒,甚至丢包。管理接口在交换机处理器处理多播时锁定,而不是在硬件中完成。
希望对您有所帮助,当我们最终搬过来时,我会回复。
某些戴尔交换机不支持多播 NLB。这就是您遇到性能问题的原因。此外,您还会看到 CPU 使用率过高。您可以在此链接中查看更多相关信息。
http://www.dell.com/us/business/p/powerconnect-6200-series/pd
另一个关于管理网络 ping 丢失的案例与固件版本有关。新固件解决了这个问题。我建议你更新你的固件级别。