我希望那里的人能够看到这个并让我知道我错过了什么。我有 4 台机器,出于某种原因,其中只有 1 台可以通过它们的私有 IP 地址(在 eth1 上)与另外 3 台通信。
这4台机器是:
mach01 10.176.193.17 马赫02 10.176.193.92 马赫03 10.176.193.27 马赫04 10.176.195.9
所有的机器都是 Debian lenny。从mach02 可以ping 其他3 台机器没问题,从其他机器可以ping 通mach02。但是,从 mach01、mach03 和 mach04 我只能 ping mach02。
所有机器上“iptables --list”的结果是:
链输入(策略接受) 目标 prot opt 源目标 Chain FORWARD(政策接受) 目标 prot opt 源目标 链输出(策略接受) 目标 prot opt 源目标
所以我不相信有防火墙问题。所有机器上 eth1 的路由表是:
10.176.192.0 * 255.255.224.0 U 0 0 0 eth1 10.191.192.0 10.176.192.1 255.255.192.0 UG 0 0 0 eth1 10.176.0.0 10.176.192.1 255.248.0.0 UG 0 0 0 eth1
所以看起来也不错。由于某种原因,从 mach03 到 mach02 以外的任何地方的 ARP 请求都失败了,对于其他机器也是如此。
mach03$ arping -c 1 -I eth1 10.176.193.17 ARPING 10.176.193.17 --- 10.176.193.17 统计 --- 发送 1 个数据包,接收 0 个数据包,100% 未应答
我看不出 ARP 会像这样失败的任何原因,并且已经没有想法和地方可以查看。在网络故障排除方面有更多经验的其他人有什么想法吗?
谢谢
编辑
尝试从 mach03 ping mach01 后,ARP 缓存中出现以下内容:
$ arp -a ? (10.176.193.17) 在 eth1 上的 <incomplete> ? (67.23.45.1) 在 00:00:0C:07:AC:01 [ether] 在 eth0
反之亦然(从 mach03 到 mach01):
? (10.176.193.92) 在 40:40:FA:77:D7:94 [ether] 在 eth1 ? (10.176.193.27) 在 eth1 上的 <incomplete> ? (67.23.45.1) 在 00:00:0C:07:AC:01 [ether] 在 eth0
以及有关 eth1 的更多详细信息:
$ ip addr 显示 dev eth1 3: eth1: mtu 1500 qdisc pfifo_fast 状态 UNKNOWN qlen 1000 链接/以太 40:40:16:e0:f3:dd brd ff:ff:ff:ff:ff:ff inet 10.176.193.17/19 brd 10.176.223.255 范围全局 eth1 inet6 fe80::4240:16ff:fee0:f3dd/64 范围链接 valid_lft 永远首选_lft 永远
好吧,您已经打折了防火墙,所以...
以我极其有限的网络知识,我能想到的唯一事情是:
'arping' 是否从 01/03/04 到 02 工作,或者他们是否根据来自 02 的传入广播数据包更新其 arp 缓存?
有点奇怪,一开始我会尝试在 mach01、mach02 和 mach03 上运行 tcpdump,以查看当您尝试 ping mach01 时,mach01 和 mach02 是否从 mach03 获取 ARP 请求,如果它正在回复(对于 mach03),等等
。你知道主机之间是否可以有透明防火墙?这可以解释你所看到的。
什么是网络拓扑?主机之间有很多切换还是只有一个?什么样的开关?
您是复制/粘贴此信息,还是尝试输入?您的网络中有“193”,除了一台机器显示 195。然后您在路由表中显示 192。
首先,挑两台不能互相通信的机器,先排除故障。从无法与另一个对话的两个中选择一个,我们将使用那个。
您的路由表看起来很奇怪,您为两条路由设置了网关标志,其中第二条与您的原始网络路由重叠。您是否出于某种原因设置了静态路由?
首先,刷新您的路由表:
其次,只添加回 LAN 子网的路由
那些机器仍然无法接触吗?
如果这不起作用,请粘贴输出
我的猜测是某些 VPN 软件/虚拟化软件/您或同事错误地修改了您的路由。
请问您能粘贴其中一台主机的完整主机路由表吗?另一个接口可能有更具体的路由。
另外,请您在一次失败的“arping”尝试后立即发布“arp -a”的输出吗?这应该会显示您尝试在 [eth1] 上 arping 的 IP 地址的不完整条目,并将确认您的主机路由配置正确。
事实证明,我发现了 Rackspace Cloud Server 的网络问题。该问题已升级并已得到解决。
我要感谢所有回复的人。