问题:我的音乐服务器代码使用阻塞套接字上的简单 TCP 连接,需要将字节流式传输到客户端(恰好是 Logitech 挤压盒)。这并不复杂 - 从文件中读取 64k,将其写入挤压箱,然后重复。它都在一个不忙的本地局域网上运行,服务器和squeezebox客户端插入同一个交换机。挤压盒不会很快消耗流,所以服务器,在几乎任何硬件上,都应该没有问题保持客户端的馈送。
而当服务器运行在树莓派 3B+ 上时,它实际上完全没有问题。pi 零可能会跟上。当它在我的 Linux 笔记本电脑上运行时,同上,一切都很好。我可以定期询问挤压箱它的内部缓冲区有多满,它很快就会达到大约 99+%,并保持在那里。如您所料,服务器 write()s(在前几个之后)大部分时间都被阻塞了。
但是我将服务器移动到运行 Linux 的 Azulle Inspire 上,插入同一个交换机,结果出现了可怕的错误。音乐开始播放,但很快就断断续续地消失了。挤压箱报告缓冲区开始填满,但随后出现了一些问题,缓冲区迅速清空(有时会稍微增加一点,所以我认为有些流量通过了,但还不够接近),音乐停止了。服务器声称它正在继续写入,尽管写入时间比我预期的要长。
请注意,Azulle 偶尔还有其他网络任务,它们都工作正常,尽管我可能不会注意到大多数其他应用程序的短暂网络延迟。但是当音乐服务器运行时,NUC(和网络)处于空闲状态——这不是 CPU 或带宽问题。
我尝试过更换电缆、更换开关并在开关上使用不同的端口。我试过发送不同的缓冲区大小。没有效果。我能想到的只是 TCP 堆栈或以太网硬件有一些非常不可靠的地方。
我该如何调试?流出来的 linux 笔记本电脑运行得很好,运行的是 Linux 4.15.0-55-generic(并且 apt upgrade 不会改变这一点)。Azuelle 运行的是 Linux 4.15.0-64-generic,Mint。我不敢相信 4.15.0 中的 TCP 处理发生了根本性的变化。我对tcpdump之类的工具不是很熟悉,更不用说内核配置或调试了,所以我正在寻找一些手把手...
linux 笔记本电脑和 Azuelle 之间的 ping 时间始终在 0.2 毫秒和 0.35 毫秒左右,典型值为 0.33 毫秒。
我迷路了。TIA。
使用 tcpdump 捕获您的流:
其中
iface
是网络接口,xxx
是两个端口号之一。然后
out.cap
用wireshark打开,看看你能从trace中得到什么。那里发生了什么应该很明显。如果没有,请再次发布。FWIW,从您所说的来看,这听起来像是 MTU 问题。
嗯,这就是我需要的线索。
当我对 MTU 大小感到好奇时,我发现了这一点:
/sys/class/net/enp1s0/mtu:1500 /sys/class/net/lo/mtu:65536 /sys/class/net/wlp2s0/mtu:1500
一切都很好,但 wlp 看起来像无线连接。无线?那还开着吗?所以我在 wlp... 界面上进行了 tcpdump,我看到了一条我从协议中识别出来的消息,然后是一长串的 ACK,没有别的,并且流播放了几秒钟的音乐并失败了。
然后我关闭了无线并再次尝试。没有口吃。一切顺利。
奇怪的是服务器距离无线接入点只有几英尺。即使它正在使用它,也不应该没有足够的带宽。我想知道由于某种原因,同时打开两者是否会导致问题,但我认为这是不可能的......