我在网络方面遇到了一个问题,我无法解决这个问题,因为我不是一个强大的网络人来解决这个问题。从我们的供应商那里,我们通过 HSRP 有 2 个分线进入我们堆叠的 cisco 2960 交换机。所以每个开关都有一个下降。从那里我们在交换机后面有两个 Astaro 设备,用于处理所有防火墙和 VLAN 路由。然后这些反馈到 Cisco 2960 上,所有 VM 主机都在同一个 2960 上所以它看起来像
-------------- --------------
|------ | Cisco 1 2960 | <--------> |Astaro 1 / VMS|
| ______________ --------------
----------- --------
| Uplink |
|---------- --------
| -------------- --------------
|-------| Cisco 2 2960 | <--------> |Astaro 2 / VMS|
-------------- --------------
所以在任何时候,思科都是堆栈的主人,而阿斯塔罗也是主人。
说我有以下场景
Master Astaro 排名第一 Master Switch in the stack 排名第二
如果我重新加载 switch #2,当 switch 1 接管并且事情重新协商时,我会得到大约 2 分钟的停机时间。
我的一些思科配置看起来像
spanning-tree mode rapid-pvst
spanning-tree extend system-id
no spanning-tree vlan 1,100
interface GigabitEthernet1/0/1
switchport access vlan 100
switchport mode access
switchport nonegotiate
duplex full
!
interface GigabitEthernet1/0/2
switchport mode trunk
switchport nonegotiate
!
interface GigabitEthernet1/0/3
switchport mode access
switchport nonegotiate
!
interface GigabitEthernet1/0/4
switchport access vlan 100
switchport mode access
switchport nonegotiate
!
端口 1 是我的提供商,2-4 是到 astaro 的交换机,用于管理端口/vlan 端口和 wan 端口。
如果我重新启动交换机,我不知道为什么我不能比 2 分钟的故障转移更好。
编辑
下面是我们“堆栈”的配置
sw1a>show switch
Switch/Stack Mac Address : 64d8.1431.6a80
H/W Current
Switch# Role Mac Address Priority Version State
----------------------------------------------------------
1 Member 0cd9.960b.5b00 15 1 Ready
*2 Master 64d8.1431.6a80 10 1 Ready
- 交换机上的端口 1 是我们的上行链路
- 端口 2 是返回到 astaro 的 WAN 端口
- 端口 3 是返回 astaro 的管理 vlan 端口
- 端口 4 是返回 astaro 的 vlan 端口
astaro 几乎是一个 linux 设备,它为所有 iptables 和 linux 为网络提供的此类工具提供了一个 gui。
根据您的编辑和评论,我认为这不是您所看到的生成树延迟。您描述的停机时间(2 分钟)实在是太长了,无法用 STP 来解释,而且我有点怀疑 Linux 服务器是否正在使用交换机运行 STP。您基本上也在做单交换机生成树,因为交换机堆栈被认为是一个逻辑交换机。
不过,有一些 STP 调整在您的情况下可能是个好主意。首先,您可以在您的 VLAN 上重新启用生成树——没有理由将其关闭。模式 rapid-pvst 是一个好主意,除非你试图用 Linux 机器运行生成树。您还可以告诉交换机,通向您的 Linux 设备 (Gi1/0/2) 的中继线不是交换机。
这就留下了您在这里获得的其他冗余功能,即交换机堆栈本身、HSRP 以及 Astaros 上的任何东西。
我的赌注是 Astaros 的故障恢复机制。由于您提到一个是“主人”,这意味着在任何时候只有一个处于活动状态。Astaros 设备上为故障转移设置了什么样的计时器?您是否有任何日志表明备用设备在切换失败后需要多长时间才能激活?
生成树似乎不正确,因为所有 STP 都是在一台交换机上完成的,而且还因为停机时间。交换机堆栈(至少在 3750 堆栈上)故障转移也应该比这更快,尽管您可以将控制台连接到辅助交换机以查看它是否需要很长时间才能接管主机。HSRP(假设它在供应商处运行,而不是在您的交换机上运行)也会比这更快地失败,并且不应该影响您。
TL;DR——我认为是您的 Linux 机器上的故障转移计时器导致了延迟。第二名是交换机堆栈,需要很长时间才能让辅助交换机接管主交换机。