我有一个由 3 台 VMware ESXi6.0 主机组成的集群,这些主机没有获得 VMware Distributed Switch 的许可。目前,这些主机在服务器上的 2 个端口和与 vPC 连接在一起的一对 Cisco Nexus 9372PX 交换机上的每个端口之间配置了静态 LAG。服务器通过 10GbE 光纤连接。
我对 vPC 的理解是,它允许交换机在不使用堆栈的情况下跨多个设备形成聚合链路。因此,在我配置了静态 LAG 的地方,这似乎工作正常。
我担心的是,如果没有诸如 LACP 之类的协议,如果其中一台 Cisco 交换机出现故障,或者如果其中一台服务器 NIC 发生故障,则无法重新协商哪些端口可以参与 LAG,因此我们将失去理论上的50% 的流量(基于 Src/Dst IP 哈希)。
有没有更好的方法来配置这种链路聚合?在 10GbE 上,聚合链接有什么好处(我的直觉是没有),我应该让 VMware 在故障转移方面“做这件事”吗?我应该在交换机上进行什么样的配置?
我之前已经对此进行了无数次研究,所有道路似乎都指向 VMware Distributed Switch,不幸的是,它对我们来说过于昂贵。
好问题。
无需在 VMware 中运行静态 LAG。如果您无法使用 VMware 分布式交换机 (vD) 和 LACP,最好只使用 VMware 的故障转移并在标准 vSwitch 和端口组对话框中设置 NIC 选择顺序。
我不知道您的存储情况如何,但对于大多数端口组,将所有适配器设置为活动状态是可以的。
您还可以覆盖该顺序并将一个特定的 NIC 固定为活动的,另一个固定为备用的,以控制流量。
示例 VM 网络端口组:
示例 vmotion 端口组: