我的服务器上有 nagios,它正在提醒我
CHECK_NRPE: Socket timeout after 30 seconds.
但我的服务正在运行:
● nagios-nrpe-server.service - Nagios Remote Plugin Executor
Loaded: loaded (/lib/systemd/system/nagios-nrpe-server.service; enabled; vendor preset: enabled)
Active: active (running) since Sat 2020-04-18 00:31:56 CEST; 6min ago
Docs: http://www.nagios.org/documentation
Process: 4841 ExecStopPost=/bin/rm -f /var/run/nagios/nrpe.pid (code=exited, status=0/SUCCESS)
Main PID: 4845 (nrpe)
Tasks: 5 (limit: 4915)
CGroup: /system.slice/nagios-nrpe-server.service
├─4845 /usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -f
├─6346 /usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -f
├─6347 /usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -f
├─6348 sh -c /usr/lib/nagios/plugins/check_disk -e -w 5% -W 3% -c 2% -K 2% -X tmpfs
└─6349 /usr/lib/nagios/plugins/check_disk -e -w 5% -W 3% -c 2% -K 2% -X tmpfs
我试图杀死它,重新启动它,重新启动正在处理所有警报的 nagios 服务器,但没有任何效果。它从无到有,并且不知道有什么问题,因为所有其他 nagios 的服务器都在工作。
超时来自客户端插件
check_nrpe
,30 秒后终止连接。我认为 NRPE 服务器中没有适当的超时,但大多数插件应该实现超时行为。