systemd status
我停止服务后收到此消息:
Actice: failed (Result: exit-code) <...> Main PID: 4747 (code=exited, status=202/FDS)
状态 FDS 在文档中定义如下:
202 EXIT_FDS 无法关闭不需要的文件描述符,或调整传递的文件描述符。
启动服务正常,没有错误报告systemd status
问题
- EXIT_FDS 更具体的含义是什么?
- 状态码是来自我的应用程序还是来自 systemd 本身?
- 我的应用程序打开一个 TCP 套接字,它在停止时不会关闭。是这个原因吗?
- 如果是这样,我可以让 systemd 忽略延迟套接字而不将其报告为错误吗?
细节
完整的状态消息:
tool-user@tool-box:~$ systemctl status tool.service
● tool.service - Tool application
Loaded: loaded (/home/tool-user/tool.service; linked; vendor preset: enabled)
Active: failed (Result: exit-code) since Mon 2022-02-07 14:14:46 CET; 3s ago
Process: 4758 ExecStop=/bin/bash -c tool-stop && while ps -p $MAINPID >/dev/null
Process: 4601 ExecStart=/bin/bash -c tool-start (code=exited, status=0/SUCCESS)
Main PID: 4747 (code=exited, status=202/FDS)
Feb 07 14:14:31 tool-box systemd[1]: Starting Tool application...
Feb 07 14:14:32 tool-box bash[4601]: Server started on port 44680
Feb 07 14:14:32 tool-box systemd[1]: Started Tool application.
Feb 07 14:14:44 tool-box systemd[1]: Stopping Tool application...
Feb 07 14:14:45 tool-box systemd[1]: tool.service: Main process exited, code=exited, status=202/FDS
Feb 07 14:14:46 tool-box systemd[1]: tool.service: Failed with result 'exit-code'.
Feb 07 14:14:46 tool-box systemd[1]: Stopped Tool application.
服务定义文件如下所示:
[Unit]
Description=Tool application
# Standard dependencies for web server
After=network.target remote-fs.target nss-lookup.target httpd-init.service
[Service]
Type=forking
Restart=on-failure
RestartSec=10
ExecStart=/bin/bash -c 'toolStart'
ExecStop=/bin/bash -c 'toolStop && while ps -p $MAINPID >/dev/null 2>&1; do sleep 1; done'
User=tool-user
StandardOutput=syslog
StandardError=syslog
TimeoutStopSec=60
[Install]
WantedBy=multi-user.target
操作系统:Ubuntu 18.04 服务器,在 Windows 10 上的 VirtualBox 中运行。
tool-user@tool-box:~$ uname -a
Linux tool-box 4.15.0-166-generic #174-Ubuntu SMP Wed Dec 8 19:07:44 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux
由于该服务具有PID 4758
Type=forking
,ExecStart
并且您要询问的退出代码与主 PID 4747 一起列出,因此我们可以得出结论,它systemd
管理了fork()
一个子进程,然后成功地execve()
'd ExecStart 进程,因此 systemd 表- 特定的退出代码不适用于此处。如果错误来自实际的
systemd
子进程,则系统特定的退出代码表将适用fork()
于execve()
: 具体而言,错误 202 将意味着例如在服务定义中实现StandardInput=
、StandardOutput=
或StandardError=
指令时出现问题。但由于ExecStart
特别报告 PID 4601 并以 退出status=0/SUCCESS
,这不是这里发生的情况。被ExecStop
执行为 PID 4758,所以它也不是来自那个。状态码 202 来自应用程序的“主进程”(PID 为 4747 的那个),它表示应用程序开发人员想要的任何含义。
延迟的 TCP 套接字不是原因:由于您的应用程序进程死亡,内核将清除它可能拥有的任何延迟的套接字。
当然,如果应用程序没有使用 SO_REUSEADDR 套接字选项,则可能无法立即重新启动应用程序并让它使用相同的端口号,直到延迟套接字的 TIME_WAIT 过期......但这不是 systemd 的问题;这是应用程序必须自己处理的事情。
该
/FDS
部分来自systemd源代码包exit_status_to_string()
中文件中的函数 。shared/exit-status.c
如果代码具有任何标准化含义,该函数应该为状态代码的含义添加一个简短的提示。该函数可以采用一个参数来确定要使用的状态代码提示集,但是当
systemctl status
使用该函数时(即在文件中systemctl/systemctl-show.c
,它(在撰写本文时)似乎总是在将该参数设置为 时调用它EXIT_STATUS_LIBC | EXIT_STATUS_SYSTEMD
,即“根据 libc 和 systemd 本身的使用显示状态代码提示”,而不检查状态代码是否实际上来自作为 systemd 软件套件成员的进程。最终结果是状态 202 总是被
/FDS
附加到它上面,无论它是否已知具有systemd 特定的含义 “无法关闭不需要的文件描述符或调整传递的文件描述符”。这只是一个简单的表格查找:不要以为它比这更智能。(在 Unix 编程文献和程序员行话中,“fds”是“文件描述符”这个词的一种非常通用的简写。这
/FDS
也暗示了 systemd 代码中状态代码 202 的符号名称:EXIT_FDS
- 因为所有 systemd 的状态代码符号都有EXIT_
前缀,为简洁起见,已将其切掉。)