假设我有一个具有以下设置的应用程序:
- 5 个运行 Apache 的网络服务器
- 为故障转移配置了 2 个数据库
在 Zabbix(或者甚至是另一个监控套件)中,是否有可能以及我将如何监控“应用程序状态”并且仅在满足以下条件时发出警报:
- 如果 1 个网络服务器停止响应,发送“信息”警报
- 如果 3 个网络服务器停止响应,发送警告
- 如果所有网络服务器都停止响应,请发送关键信息
- 如果一个 DB 离线,发送警告
- 如果两个数据库都离线,发送灾难
我知道这看起来像 5 个问题,但根本问题是:如何创建从特定主机抽象出来的警报?在我使用过的每个监控套件中,监控项目/警报都绑定到主机,这导致了诸如“检查数据库以查看过去 10 分钟内是否所有服务器都签入”之类的丑陋解决方法,如果没有,您会收到一封类似“主机:database01.company.com - webserver05 已在 10 分钟内未签入”的警报电子邮件。该电子邮件使您相信数据库存在问题(因为检查与数据库相关联),但问题实际上出在网络服务器上。理想情况下,警报将与“公司应用程序 1”之类的抽象事物相关联。这可以做到吗?
zabbix
您可以使用triggers,它可以绑定特定的严重性。每次触发器更改其状态时,它都会生成一个事件。如果发生某些事件,您可以定义要执行的操作。此外,zabbix
具有监控用户定义的Web 监控场景的能力。关联发生在不同服务器中的事件的方法
zabbix
是定义和配置IT 服务。这可以进行非常细粒度的调整,并解决您提出的五种不同的可能性。