我很难理解 Nagios 的一些更基本的概念,我认为这些概念是直截了当的。
基本上,除了标准的本地基础设施外,我还需要监控一堆第 3 方 Web 服务,所有这些服务我都有网址。
我根本无法决定这应该如何组织。每个人都需要我创建一个我理解的新服务,但在此之后......
我应该创建一个名为“第 3 方”的主机以及链接到它的 3 个服务,还是应该创建 3 个具有站点名称的新主机、3 个服务并将它们一对一链接?
我更喜欢为每项服务使用单一主机,因为每项服务都是相互独立的,我相信这就是 Nagios 应该设置的方式。
与此同时,这些服务器无法通过 ping 访问。默认情况下,它报告为关闭。我试图禁用check_command check-host-alive
,但是,这似乎只是让主机保持灰色......
...如果唯一的服务是绿色的和/或如果我将check_command
服务更改为上面的服务,我是否可以让主机保持绿色,这是否会对 Web 服务进行两次检查,或者甚至是check_command
在其上拥有足够的,我不需要分配服务?
所以,真正的问题是……
- 我应该为每个独立服务使用一个主机,因为它们是正式不同的“主机”吗?
- 当主机只有一个服务且无法通过 ping 访问时,上述最佳实践是什么?
- (有点额外)为了组织 Nagios,对这些主机进行分组的最佳方式是什么?这是依赖项的用途吗?
我认为您的问题的答案不是确定的,但随着您对 Nagios 工作原理的更深入理解,它会随着时间的推移而显露出来。服务通常直接绑定到它们运行的主机,但正如您所发现的那样,这只是一种约定。请注意,一个有效的约定并提供了一些捷径,但仍然是一个约定。
还知道您可以将任何检查定义为主机检查。它不需要 ping。也许 check_http 更适合您的使用。
鉴于你所说的,我会创建一个虚拟服务,暂时将你的一堆第三方服务绑定到它上,然后根据你的需要进行调整。
要解决您的第三个问题,如果您按服务走主机路线,则可以使用主机或服务组将它们分组以进行显示。