我有一个支持巨型帧和链路聚合的交换机 (SRW2024)。
我有 2 台服务器(每台都有 2x Gbit nic,在内核下工作),我想连接到文件存储后端(iSCSI、openfiler)。
我已经在每台服务器(eth0+eth1)上将绑定设置为bond0,并为其配置了子网。文件服务器也有相同的网络。
网络上每个节点上的绑定模式为 4(802.3ad 动态链路聚合)。
但是,无法ping通任何主机。
在bond0 上使用tcpdump,我收到一个arp 请求“谁拥有xx3.1 告诉xx3.2”,但目标机器无法回答。
没有防火墙,没有特殊政策。
我花了几个小时尝试不同的配置......没有成功。
我正在找人让我开始,我只是迷路了。
任何帮助将非常感激。
Linksys 交换机的 Web 配置指南:
http://www.cisco.com/en/US/docs/switches/lan/csbms/srw2048/administration/guide/SRW-US_v10_UG_A-Web.pdf
第 25-26 页描述了在交换机端设置 LACP 的位置。确保在连接交换机的两个端口上设置了管理员密钥。
抱歉,我无法提供更多帮助,我只处理过 Catalyst、ProCurve 和 Juniper EX 交换机这样的事情。
仅仅因为交换机支持 LACP 并不意味着它期待它。
确保在交换机端为适当的端口配置 LACP 组。
然后,检查交换机和服务器的 LACP 状态。确保 802.3ad 链接已启动。
首先,您必须一次对每个 LAG 进行故障排除。听起来您只是插入了所有内容,并且您没有首先使用一台服务器完成设置过程。否则,听起来您是在要求我们为您阅读手册。:-)
关于交换机配置:
在交换机上,您需要为每个单独的服务器创建一个单独的链路聚合组(或“bond”或“LAG”)。因此,如果您有 Server #1 和 Server #2,则需要在交换机上配置 LAG #1 和 LAG #2。
大多数“智能”交换机(Web 界面)都有一个单独的配置页面,用于将交换机端口分配给 LAG。命令行界面有所不同,但通常有一个配置子树专门用于处理此问题。检查您的交换机手册——将有一章专门讨论这个主题。
具体来说,您需要将每台服务器的真实(物理)交换机端口分配给该服务器的 LAG。如果服务器 #1 插入交换机端口 5 和 6,则将交换机端口 5 和 6 分配给 LAG #1。服务器 #2 得到相同的处理,除了它的交换机端口被分配给 LAG #2。
为每个 LAG 配置 LAG 特定参数。确保为每个 LAG/服务器对配置相同的 LACP 超时参数。通常,您希望使用“短”(1 秒)LACP 超时,但最重要的是两端的设置相同。您还需要确保 LAG 类型正确:许多交换机支持多种链路聚合/绑定类型,主要是 Cisco 的 Portchannel 和 802.3ad。您必须为 DYNAMIC 802.3ad 操作配置 LAG,以匹配您的 Linux 机器的配置方式。
最后,您应该为每个 LAG 配置任何 VLAN、中继或其他特定于端口的参数。对于这些参数,您的交换机会将每个 LAG 视为只是另一个交换机端口 - 它可以被标记或中继,您可以打开巨型帧,您可以过滤流量等。无论您为底层真实成员提供什么设置当这些端口分配给 LAG 时,这些端口将被忽略。
配置 LAG 并分配其端口设置后,您应该能够通过交换机接口检查每个 LAG 的状态。它将报告某种链接状态,可能是整个绑定组的整体状态加上组中各个真实链接的状态。您可能会获得更多信息,具体取决于您的交换机界面。
在 Linux 服务器上,运行
cat /proc/net/bonding/bond0
(将“bond0”更改为您的绑定设备名称)以查看整个绑定和成员链接的状态。这显示了债券和每个成员链接的一个节,如果它是健康的并且正在运行,每个节都会有一个像“MII Status: up”这样的行。LACP 你好超时是错误的。将超时设置为 LONG(30 秒)。所有 cisco 设备都默认使用长定时器。这是 nexus 设备的最佳实践,因为您可以进行无中断(服务中)交换机升级。使用短的 lacp 计时器不会给你带来任何好处