我想以这样一种方式调整 nagios,以使任何关闭节点的所有检查都停止(服务未显示或显示为未知)。换句话说,我只想看到一个停机主机警报,而不是 1(停机)+ n(每个服务 1)。请注意,我对服务显示/状态感兴趣,而不仅仅是关闭通知。
基本原理:我们使用 nagios firefox/chrome 插件来监控状态,而 nagios 的行为过于嘈杂,给出这样的读数(因为每个节点都有 20 个服务):
3 down, 1 unreachable, 4 warnings, 87 critical
这意味着 up 节点上的 7 个关键服务(问题出在服务上)被淹没在一组红色服务中,这些服务之所以关键,是因为它们位于关闭/无法访问的节点上。我更愿意看到的是:
3 down, 1 unreachable, 80 unknown, 4 warnings, 7 critical
甚至
3 down, 1 unreachable, 4 warnings, 7 critical
我查看了服务依赖项,但我没有很好的描述方式:“使活动主机上的所有服务都依赖于主机检查的状态”。
我发现 这里讨论的问题,其中一位参与者认为这是一个 nagios 错误,而这里一位参与者认为它是“按设计的”。
事实上,我只对效果感兴趣,更不用说设计理念了。请注意,此 nagios 正在检查数百个节点,因此解决方案的可维护性也很重要。
TIA 和欢呼。
您可以在使用 Nagstamon 的最新版本 (0.9.11) 时隐藏它,它是 Nagios/Icinga 的桌面(托盘)状态监视器:http: //nagstamon.ifw-dresden.de/
您可以通过在状态 CGI 视图中应用过滤器来执行此操作...
Chrome/FF 插件只是从 CGI 中抓取数据,因此如果您将这些相同的过滤器添加到插件正在查询的状态 URL,您可以控制它显示的内容。
例如,如果您只希望它看到主机:
status.cgi?hostgroup=all&style=hostdetail
对于已启动的主机上的问题服务,仅:
status.cgi?host=all&servicestatustypes=28&hoststatustypes=2
有关要使用的特定值的更多信息,请参阅有关过滤器的博客文章。(它们是位字段。)
编辑:这正是 nagstamon 在您选中这些框时所做的事情,顺便说一句。