我已经设置了四台 Linux 服务器。它们的图像完全相同。我有一个便宜的 TP Link 开关,我把它们都插进去了。当全部打开并插入交换机时,机器似乎经历了疯狂的丢包,我无法连接到它们,机器无法相互连接。
连接问题扩展到尝试相互 ping 的服务器。我让每台服务器都获得了一个 IP,然后我断开了交换机与路由器的连接。当我将任何两台服务器插入交换机时,它们能够相互 ping 通,但是一旦插入第三台服务器,它们就无法继续 ping 通。鉴于即使没有插入路由器也会发生这种情况,它必须是机器或交换机上的东西。
我尝试在其中一台机器上进行数据包捕获,但除了我认为与数据包丢失一致的大量 tcp 重新传输之外,没有注意到任何其他内容。我想知道我是否会出现一些疯狂的多播流量或其他东西,但不是真的。我还尝试杀死可能正在进行网络流量的机器上的任何东西。机器上的适配器设置对我来说都很正常,但我不确定是什么原因造成的。
我也尝试用另一个相同品牌和型号的开关换掉,但它有同样的问题。我想知道开关是否发生了一些奇怪的事情,但我对此一无所知。
在调试方面不确定接下来要尝试什么。我觉得我忽略了一些简单的事情。
首先简单的东西......确保您没有分配任何重复的IP地址,并且所有主机上的网络掩码都相同。
接下来我建议您手动将所有三台主机上的接口速度和双工设置为 100/Full。基本上,关闭自动协商。
那里有很多便宜的交换机不能很好地自动协商。而且,即使交换机可以,也有便宜的 NIC 也不能很好地处理它。通过手动将每台主机设置为固定速度和双工,您可以将其作为因素之一消除。
在这里发帖以防万一发生这种情况以帮助遇到此问题的其他人。事实证明,接口上启用了 LACP,而我使用的交换机不支持它。