AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 1015930
Accepted
Jakub Kuszneruk
Jakub Kuszneruk
Asked: 2020-05-07 04:55:22 +0800 CST2020-05-07 04:55:22 +0800 CST 2020-05-07 04:55:22 +0800 CST

让 systemd 服务稍后停止,而不会阻塞 `systemctl stop`

  • 772

我有一堆服务负责运行队列中消耗的操作。

我希望能够轻轻地重新启动服务(不中断已经运行的操作)

可以通过处理 systemd 发送的 SIGTERM 并保存程序在当前操作处理后应该退出的信息来解决。
还有一个小问题是,在服务配置文件中定义的一段时间后,TimeoutStopSecsystemd 将发送额外的 SIGKILL 以残酷地终止我的进程。
我可以通过设置轻松避免它TimeoutStopSec=infinity。然后systemctl stop'将等到脚本自行终止,这可能会持续一个多小时,并导致我遇到主要问题。

我不希望systemctl命令等到脚本结束

看起来SendSIGKILL=no配置完成了这项工作。SIGTERM这导致在之后重试TimeoutStopSec,然后创建新的工作人员,并让旧的工作人员继续运行。

journalctl 日志

May 06 14:14:43 jaku systemd[1]: Stopping Jaku test worker...
May 06 14:14:43 jaku python3[31597]: * 15 <frame object at 0x14d8108>
May 06 14:14:53 jaku systemd[1]: jaku-test-worker.service: State 'stop-sigterm' timed out. Skipping SIGKILL.
May 06 14:14:53 jaku python3[31597]: * 15 <frame object at 0x14d8108>
May 06 14:15:03 jaku systemd[1]: jaku-test-worker.service: State 'stop-final-sigterm' timed out. Skipping SIGKILL. Entering failed mode.
May 06 14:15:03 jaku systemd[1]: jaku-test-worker.service: Failed with result 'timeout'.
May 06 14:15:03 jaku systemd[1]: Stopped Jaku test worker.
May 06 14:15:03 jaku systemd[1]: jaku-test-worker.service: Found left-over process 31597 (python3) in control group while starting unit. Ignoring.
May 06 14:15:03 jaku systemd[1]: This usually indicates unclean termination of a previous run, or service implementation deficiencies.
May 06 14:15:03 jaku systemd[1]: Started Jaku test worker.
jaku@jaku:/nfs/home/jaku/tmp$ ps aux | grep "sig.py"
jaku     31597 99.9  0.0  31884  9916 ?        Rs   14:00  15:10 /usr/bin/python3 /home/jaku/tmp/sig.py
jaku     32359  100  0.0  31884 10032 ?        Rs   14:15   0:43 /usr/bin/python3 /home/jaku/tmp/sig.py
jaku     32483  0.0  0.0  15968  1040 pts/7    S+   14:15   0:00 grep --color=auto sig.py

解决方案看起来像是在做它的工作,但我很担心这句话:

这通常表示先前运行的不干净终止,或服务实现缺陷。

我错过了什么或者它真的是最好的解决方案吗?

参考:

  • 系统服务
  • systemd.kill。
python signals systemd
  • 3 3 个回答
  • 6187 Views

3 个回答

  • Voted
  1. John Mahowald
    2020-05-07T06:55:08+08:002020-05-07T06:55:08+08:00

    systemd 停止服务的想法是终止与该单元的 cgroup 关联的所有进程。运行ExecStop=之后再发送KillSignal=,最后如果有必要FinalKillSignal=。对我来说似乎很合理。

    您的软件正在处理 SIGTERM,使进程保持活动状态,然后将该单元配置为不发送 SIGKILL。systemd 认为这是损坏的,警告意味着“服务实现缺陷”。它没有停止。

    我不希望 systemctl 命令等到脚本结束

    然后在一分钟左右关闭。服务的用户不想等待它关闭;DefaultTimeoutStopSec=大概是90年代。虽然您的服务单位可以增加TimeoutStopSec=,但我认为一个小时是不合理的时间来等待初始化脚本中停止的事情。

    如果您有(同步)停止脚本,请将其实现为ExecStop=. 如果不是,请立即将 SIGTERM 处理为正常关闭。启用 SIGKILL 作为停止它的最后手段。


    除了杀死它的进程之外,还有其他方法可以阻止服务开始工作。例如,将其从负载均衡器中移除并耗尽负载。

    • 1
  2. Best Answer
    Jakub Kuszneruk
    2020-05-08T09:26:55+08:002020-05-08T09:26:55+08:00

    看起来没有办法解决它,这里有一些 相关的线程。但是......我不希望命令等到脚本结束
    的假设是错误的。systemctl

    我希望这个命令简短,因为它必须是 jenkins 部署的一部分,而且我不希望部署过程花费超过几分钟。
    我不知道的是,中断systemctl命令不会停止关闭服务的过程,所以可能的解决方案是:

    systemctl有时间限制的运行命令,例如timeout 60 systemctl restart services-preifx-* || echo "processes will be restart in background"

    现在TimeoutStopSec可以设置为某个较高的值(如 10h)以防止服务永远重启。

    另外KillMode=process必须设置,不要中断任何子进程。

    • 1
  3. Lii
    2022-03-03T07:00:00+08:002022-03-03T07:00:00+08:00

    听起来您想systemctl使用该--no-block参数运行:

    systemctl --no-block stop service-name
    

    --no-block

    不要同步等待请求的操作完成。如果未指定,作业将被验证、入队并且 systemctl 将等待直到单元的启动完成。通过传递这个参数,它只被验证和排队。此选项不能与--wait.

    • 1

相关问题

  • 在 cygwin/XP 下安装完整 Python 的最佳方式?

  • Mac OS X:从 python 脚本中更改 $PATH

  • 可以使用 easy_install 和 bdist_rpm 安装吗?

  • 我可以“注册”python 脚本以在 Windows 上执行吗?

  • 如何使用脚本远程重启 Windows 服务?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve