前言:
我有一个我目前正在测试的应用程序在RHEL 6
. 我的测试设置是安装在嵌入式设备上的应用程序,通过以太网电缆连接到 PC,该 PC 与运行 Linux 的 PC 上的虚拟机通信。pc 上的虚拟机(在 VMWare 工作站上)和嵌入式设备都具有静态 IP 地址,因为它们需要通过以太网电缆相互通信。
在这种情况下,应用程序需要使用pub-sub
工具进行通信RTI DDS
。这已经在无线环境和另一个有线环境中使用不同的 PC 但相同的虚拟机进行了测试,并且在这两个环境中 pub-sub 都有效。
问题:
在当前设置上测试 pub-sub 时,我们可以看到wireshark
从嵌入式设备传递的所有碎片数据包都传递到 PC 的主操作系统(本例中为 windows)。但是,当碎片数据包从主操作系统发送到虚拟机操作系统时,虚拟机只接收如中所示接收到的最后一个数据包,wireshark
其余数据包被丢弃。
到目前为止,我们已经尝试禁用firewalls
和pinging
设备,这些设备都可以正常工作并且没有问题。因此,我们无法深入了解数据包被丢弃的原因。
有什么方法可以调试网络数据包被丢弃的方式和原因,甚至可以通过wireshark来调试,因为我们目前正在使用该工具?
一般来说,我怀疑 MTU(帧大小)是问题的根源。我有几个理由和一些建议。
首先,这种行为因 L2 而异(它只发生在有线流量而不是无线流量中)。这本身就是可疑的,表明接口级别存在问题。
其次,数据包碎片是 MTU 未对齐的症状。数据包碎片本身不是问题,但它不是最佳的,因为它会产生开销和额外的故障点。
第三,您的 Linux 来宾虚拟机仅收到“收到的最后一个数据包”,这是某些 VMware NIC 和版本的已知问题。
现在,由于主机正在接收任何情况,并且由于MTU 大小仅影响发送的数据包,因此您无法更改 VM 上的 MTU 并期望有任何不同。但是,您可以执行以下操作:
建议
确定 MTU 是否有问题
跑吧
ping -f -l (your host vm adapter mtu, which is a #) your.guest.ip.or.name
,喜欢ping -f -l 1500 myguest
。如果它在您使用
-l
当前 MTU 的值时有效,那么我错了,请忽略。否则,请继续降低该-l
值直到它响应,然后将您的主机虚拟适配器设置为具有该 MTU。见http://www.thincomputing.net/2011/06/28/mtu-size-mismatch-a-major-cause-of-disconnections/在 vmware 工作站中使用不同的 vNic驱动程序
某些操作系统和某些 vNic 以及某些虚拟机管理程序存在已知问题。我在下面对已知 vmware 问题进行了一些研究,但只是尝试在来宾上使用不同的 vNIC 驱动程序。如果您使用的是 E1000,请尝试其中一款较新的。如果您使用的是 vmxnet3,请尝试 2 或 E1000。等等。如果这修复了它,您可以保留它或查找您之前拥有的特定驱动程序,以了解如何从 vmware 修复它。
在您的主机上尝试较低的 MTU
将主机上的 MTU 从现在的位置(可能大约 1500)降低到大约 1380。如果问题消失,请继续增加它,直到达到大约 1468。离开它。