我正在尝试使用 python 套接字通过 TCP/IP 与商用电源设备进行通信。
我尝试在同一网络接口上同时使用虚拟 linux(centos8stream)和虚拟 windows10,它们都在同一台物理计算机上运行。两者都有python3.9。
我想象 tcp/ip 套接字在两个操作系统中都可以正常工作,但我只在 linux 中遇到了一些通信问题:
- 几次尝试后,发送和接收之间的延迟变得更长(2 秒而不是 0.14 秒)
- 有时我会超时,根本无法与设备通信。
我让 Wireshark 在两个操作系统中运行:
- 在 Windows 中没有异常消息(很少有 TCP 重传)
- 在 linux 中,一段时间后(或有时立即)wireshark 会被 TCP Dup Ack、TCP Fast Retransmission 和 TCP Spurious Retransmissions 淹没。
我的问题:
- 差异的根源可能是什么?我可以尝试任何套接字选项吗?
- 有没有办法比较linux和windows10中的网络参数?
连续读取设备标识的示例程序:
import socket
from time import sleep,time
HOST = '10.27.4.50'
PORT = 4444
#Create object and open the connection
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect((HOST, PORT))
client.settimeout(5)
# Read identification
message=(b'*IDN?\r\n')
for i in range(5):
start_time = time()
client.sendall(message)
rep=client.recv(1024)
print("Trial {}, delay: {} seconds ".format(i,time() - start_time))
sleep(1)
client.close()
视窗:
Trial 0, delay: 0.17121100425720215 seconds
Trial 1, delay: 0.10957813262939453 seconds
Trial 2, delay: 0.17148327827453613 seconds
Trial 3, delay: 0.13976049423217773 seconds
Trial 4, delay: 0.14109373092651367 seconds
linux(看到最后一条消息需要更长的时间才能收到响应,这对应于 TCP 错误的开始)
Trial 0, delay: 0.15080499649 seconds
Trial 1, delay: 0.143104076385 seconds
Trial 2, delay: 0.170531988144 seconds
Trial 3, delay: 0.183187961578 seconds
Trial 4, delay: 2.0480530262 seconds
注意:我还尝试了一台物理 linux 机器,也有同样的问题。
我认为问题与 tcp 时间戳有关。在 linux 中,默认情况下 tcp_timestamp 是启用的,在 windows 中它是禁用的。
在 linux 上禁用 tcp 时间戳,可以解决问题:
相反,在 Windows 上启用时间戳会重现我在 linux 上观察到的相同问题。
进一步挖掘,我发现设备发送数据包时开始发生诸如 Dup Ack 之类的 tcp 错误,其时间戳低于前一个数据包。设备的硬件/固件中可能存在错误,它会创建错误的时间戳。