AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 784656
Accepted
SmallClanger
SmallClanger
Asked: 2024-10-07 16:37:12 +0800 CST2024-10-07 16:37:12 +0800 CST 2024-10-07 16:37:12 +0800 CST

单播 UDP 套接字 tx 缓冲区已填满,正在等待 ARP

  • 772

我有一个“理解”问题,但它确实有一个我已经简化的真实案例。考虑这个示例网络(使用简化的 IP): UDP 流程图示例 从左到右:

  • 三台主机 S1-S3 (IPs),分别运行三个程序 R1-R3;一台有 3 个 VLAN 的交换机和一个连接到第 4 台主机 S4 的 eth0 的 trunk 端口。所有这些都是 Ubuntu 20.04 LTS,但这可能无关紧要。
  • S4 正在运行 P1,它绑定到三个 UDP 套接字,分别位于 S1、2、3 各自网络上的三个 VLAN 接口上
  • P1以 10-100Hz 的速率向每个套接字上的多个端口发送单播和OUTPUT多播 UDP 消息。有一个 netfilter链控制这些流。

每个红色区域代表可能出现“故障”的情况。除一种情况外,所有其他情况下,UDP 数据报都会被立即丢弃:

  • 虚拟接口V10链路断开;进程R2未运行;或OUTPUT链式DROP传输 - 在每种情况下,数据包要么被 S2 默默丢弃,要么向 P1 报告错误并丢弃数据包。所有其他组播继续传输。
  • 对于 S3 的情况,移除阻止后OUTPUT,tx套接字的缓冲区v12会迅速被发往的单播数据包填满12.1,从而阻止任何进一步的单播和多播写入。

在此状态下,straceonP1可能看起来像这样(修剪后):

15:38:27 sendto(9, ... {sa_family=AF_INET, sin_port=htons(2347), sin_addr=inet_addr("12.1")}, 16) = 31674
15:38:27 sendto(9, ... {sa_family=AF_INET, sin_port=htons(2347), sin_addr=inet_addr("12.1")}, 16) = 31674
15:38:27 sendto(9, ... {sa_family=AF_INET, sin_port=htons(2347), sin_addr=inet_addr("12.1")}, 16) = 31674
15:38:27 sendto(9, ... {sa_family=AF_INET, sin_port=htons(2347), sin_addr=inet_addr("12.1")}, 16) = -1 EAGAIN (Resource temporarily unavailable)
15:38:30 sendto(9, ... {sa_family=AF_INET, sin_port=htons(2347), sin_addr=inet_addr("12.1")}, 16) = 31674
15:38:30 sendto(9, ... {sa_family=AF_INET, sin_port=htons(2347), sin_addr=inet_addr("12.1")}, 16) = 31674
15:38:30 sendto(9, ... {sa_family=AF_INET, sin_port=htons(2347), sin_addr=inet_addr("12.1")}, 16) = 31674
15:38:30 sendto(9, ... {sa_family=AF_INET, sin_port=htons(2347), sin_addr=inet_addr("12.1")}, 16) = -1 EAGAIN (Resource temporarily unavailable)

并ss显示问题:

State    Recv-Q  Send-Q   Local Address:Port   Peer Address:Port  Process
UNCONN   0       148992   0.0.0.0:51047        0.0.0.0:*          users:(("task",pid=381888,fd=9))
     skmem:(r0,rb212992,t148992,tb131070,f0,w0,o0,bl0,d0)

因此,我们向套接字缓冲区 (默认 120kb) 写入了 4 * ~30kb,并EAGAIN在缓冲区已满时报告第 4 次写入。缓冲区不断被填满,而操作系统却在等待永远不会到来的ARP响应。S3

以上这些背后有两个问题:

  1. UDP 本质上是不可靠的。我们的应用程序很高兴看到数据包被丢弃,那么为什么tx在内核尝试解析 ARP 时会以这种方式排队呢?(考虑一下 S3 可能只是偶尔连接但其他主机可能仍然可以访问的情况v12。)
  2. 缓冲区似乎每 3 秒清空一次(然后迅速被新写入填充)。结果之一是,进入同一tx队列的任何多播都会以小爆发的方式发出,而不是以稳定的发送速率发出。当然,我们可以打开更多发送套接字,但这个值在哪里设置,这种行为是否可以调整sysctl?
networking
  • 1 1 个回答
  • 103 Views

1 个回答

  • Voted
  1. Best Answer
    grawity
    2024-10-07T17:06:50+08:002024-10-07T17:06:50+08:00

    UDP 本质上是不可靠的。我们的应用程序很高兴看到数据包被丢弃,那么为什么在内核尝试解析 ARP 时 tx 会以这种方式排队?(考虑 S3 可能只是偶尔连接但 v12 上的其他主机可能仍然可以访问的情况。)

    您的应用程序可能如此,但大多数其他应用程序在数据包被丢弃时并不高兴。它们通常有超时和重新传输,但这些通常比 ARP 查询成功所需的时间长得多。

    例如,如果内核因为必须向网关发出 ARP 查询而丢弃 TCP SYN(而不是将其排队),则重新传输将需要 3 秒,而 ARP 响应则需要约 0.003 秒。基于 UDP 的 DNS 查询和大多数其他协议也是如此。(更不用说那些没有重新传输的协议了——UDP 上的 Syslog 没有,如果消息发送频率不够高,无法保持 ARP 缓存条目处于活动状态,那么大多数消息都会丢失。)

    缓冲区似乎每 3 秒清空一次(然后迅速被新写入填充)。结果之一是,进入同一 tx 队列的任何多播都会以小突发的方式发出,而不是以稳定的发送速率发出。当然,我们可以打开更多发送套接字,但这个值在哪里设置,这种行为可以在 sysctl 中调整吗?

    net.ipv4.neigh.*.unres_qlen_bytes似乎是 sysctl(以及已弃用的.unres_qlen)控制可以为未解析的邻居排队多少数据。

    相邻的.mcast_solicit× .retrans_time_mssysctls 控制在邻居条目进入“FAILED”状态并且其所有排队数据包被丢弃之前,将重试多播请求或广播 ARP 查询的次数(以及间隔)。

    (一旦发生这种情况,下一个数据包将触发一系列新的邻居发现尝试,同时新的数据包再次排队,从而导致默认设置下的 3 秒周期。)

    如果您尝试在 Linux 源代码中找到它,请 grep并专门在 中QUEUE_LEN_BYTES查找。似乎队列附加到您在 中看到的相同邻居条目,尽管它没有显示每个邻居队列大小。__neigh_event_send()net/core/neighbour.cip [-s] neigh

    • 3

相关问题

  • 查找与端口关联的线程/脚本?

  • 关于网络挂载文件的问题

  • IP地址可以以255结尾而不是广播IP地址吗?

  • 无法识别arp命令或ip命令哪个MAC地址输出正确

  • 奇怪的路由器与centos 6一起工作[关闭]

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve