我们有一个 Zabbix 环境,我们试图通过安装在每个位置的代理来监控客户网络上的系统。许多客户站点共享相同的 IP 范围,这对 Zabbix 来说似乎是个问题。
我们遇到了一个问题,即受监控的主机在代理之间跳动。正常时,主机看起来像:
但由于某种原因,该站点的 server3.office.wolpertinger.com 主机被分配给 aardvark 的代理:
(这发生在几个不同的主机上,但我选择专注于这个特定的主机以进行诊断)
这个问题的最终结果是,当 zabbix 服务器为代理构建配置时,它可能没有包含所有必要的主机信息,以便代理可以正确监控代理。
例如,服务器在发送到 wolpertinger 的代理时将无法包含有关 server3.office.wolpertinger.com 的信息,然后该服务器突然被标记为无法访问一个小时。
我试过了:
- 将设备唯一性标准更改为“IP 地址”(这是原始配置)
- 将设备唯一性标准更改为“system.uname”
- 禁用发现操作规则
都没有效果。
我需要做什么来解决这个问题?
aardvark 的发现规则状态:发现规则的监控页面:
(你可以看到 zabbix 对它所看到的主机感到困惑,尽管发现规则被设置为通过 system.uname 进行区分)
wolpertinger 的发现规则状态:发现规则的监控页面:
发现动作规则:
各个主机的实际主机配置为: 注意:这里的代理应该是 wolpertinger
和:
有一次我意识到 Windows 不使用 system.uname 中的 FQDN,所以我认为它在主机之间可能是相同的:
server2.office.aardvark.com: Windows SERVER2 6.1.7601 Microsoft Windows 7 Professional Service Pack 1 x86
server3.office.ostrich.com: Windows SERVER3 6.1.7600 Microsoft Windows Server 2008 R2 Standard Edition x64
server2.office.ostrich.com: Windows SERVER2 6.1.7600 Microsoft Windows Server 2008 R2 Standard Edition x64
server3.office.wolpertinger.com: Windows SERVER3 6.1.7601 Microsoft Windows 7 Professional Service Pack 1 x64
server2.office.wolpertinger.com: Windows SERVER2 6.0.6002 Microsoft Windows Server 2008 Standard Edition Service Pack 2 x86
这已被确定为 Zabbix 中的一个问题,并由新功能ZBXNEXT-1267 修复。