这是分布式 Icinga 1 环境。
我在 Icinga 1 客户端/卫星上有大约 100 台主机,它们处于 UNREACHABLE 状态。每个主机的所有四项检查都返回 OK 状态,但设备的整体状态是 UNREACHABLE。
问题可能是由于我让 Icinga 1 以错误的 /usr/lib64/nagios/plugins/check_icmp 权限运行所致。(check_icmp 没有设置 suid 位。)
所以我停止了 Icinga 并清空了卫星上的状态保留文件(state_retention_file=/var/spool/icinga/retention.dat),但这并没有帮助。如果我清空主机上的同一个文件可能会有所帮助吗?
ps 显示我的 submit_check_result.sh submit_host_check.sh 脚本作为僵尸运行,但它们的寿命不长。
我不得不在客户端恢复我的支票转发脚本。
以下是破损的部分。
这似乎已经解决了这个问题。
猫 /etc/icinga/scripts/submit_check_result.sh
猫 /etc/icinga/scripts/submit_host_check.sh