我只想监控一小部分服务器(少于 10 台)。
从不同的地方来看,最重要的竞争者(至少对于开源)是:
- 纳吉奥斯
- 穆宁
- 扎比克斯
根据我的阅读,很多人倾向于将 munin 和 nagios 一起使用—— munin 用于历史和图表,而 nagios 用于警报。
另一方面,听起来 Zabbix 是一个更完整的解决方案,并且比其他两个更容易配置。所以我想走那条路。
我现在的想法是:
- Zabbix 的一般缺点是什么?
- Zabbix 在它监控的盒子上占用的空间很小吗?
- 我真的需要为它设置一个完整的其他服务器吗?我目前有一台负载非常轻的服务器——我可以将它用作双重用途吗?
我认为最好专注于回答您的具体问题,同时考虑到您计划部署的规模(约 10 个受监控的主机)。
Zabbix 的一般缺点是什么?
Zabbix 在它监控的盒子上占用的空间很小吗?
当然是。Zabbix 可以使用 SNMP 等方法进行监控,简单的网络检查(端口是否打开?),它还具有适用于许多平台的本地代理。由于代理是用 C 编写的,因此它占用的空间非常小(与一堆解释脚本相反......)。您可以在单个受监控的主机上轻松组合不同的检查。请注意,您不仅限于监控服务器,还可以添加网络设备和其他东西。
我真的需要为它设置一个完整的其他服务器吗?我目前有一台负载非常轻的服务器——我可以将它用作双重用途吗?
取决于 - 如果它正在运行服务器支持的操作系统之一 - 绝对。对于那种环境要求将非常低。确保仅使用默认模板作为指导,建议您创建自己的模板,并在检查之间留出更长的时间间隔。基本上,Zabbix 由 3 个组件组成——数据库、前端、服务器。如果您愿意,您可以将公司现有的数据库服务器和现有的网络服务器用于前两个组件,然后在任何支持的平台上运行 Zabbix 服务器——这是一个完全有效的配置。
在 Freenode 上的#zabbix 中非常欢迎任何特定的查询。
在我使用 Nagios 之前,我使用 Zabbix 已有 2 年了……
在我看来,最大的区别是:使用 Nagios 你会得到一个状态(OK/WARNING/CRITICAL),使用 Zabbix 你会得到一个数据(整数、浮点数、字符串......)
这对 Zabbix 来说是一个非常好的观点,因为:
使用代理轻松/快速收集基本系统数据也非常好。
Zabbix的缺点:
您的监控目标是什么?正常运行时间?表现?计费指标?您上面列出的一些实用程序更适合这些用途,而有些则更差。
为了保证正常运行时间,我们使用monit,它既免费又易于在 Unix/Linux 系统上设置。该实用程序监视一个进程是否处于活动状态,并确保它使用的资源(CPU、内存)不超过其公平份额——如果它行为不端,monit 将重新启动该进程。
对于性能监控,我建议使用munin。它易于配置,并使用 perl/bash/python/whatever 作为数据收集方法。Munin 能够在一个地方收集多台机器的性能,并构建易于理解的图表。
对于计费指标(带宽消耗),我建议PRTG。它不是免费的,但提供专业级别的报告和统计数据,如果您这样做,可以轻松地将其用作客户计费报告的一部分。我们将需要在每台受监控机器上使用代理的 Zabbix 安装替换为使用 SNMP 的 PRTG,并且我们从未回头。
我也使用过Zenoss,它非常好,而且安装和配置都很简单。Zenoss 需要很长的训练时间来学习如何获得我们需要的所有指标。
我使用 zabbix 来监控我们公司的基础设施(只有 6 台服务器 + 所有网络的东西)。我已经使用 zabbix 两年多了,效果很好。我喜欢它全部在一个应用程序中并且不需要安装大量插件的事实。该界面没有赢得任何设计奖项,但在功能方面的布局却出奇的好。过去我在我们的服务器上遇到过一些间歇性的硬件问题,并且在 zabbix 中拥有大量历史数据肯定有助于解决这些问题。
有些版本似乎存在稳定性问题并且偶尔会崩溃,但 monit 解决了这个问题。
我建议将 zabbix 放在一个单独的盒子上(一些 3-4 年前退役的服务器硬件会很好地工作)应用程序本身不是很重,但它确实给数据库带来了很大的压力(在我的例子中是 mysql) -保存所有历史数据并不便宜。
我用过 Zenoss 和 Zabbix。我对 Zabbix 的一个抱怨是它似乎总是让我崩溃。我在以前的工作中安装了一个装置,我们在 Zabbix 和 Zenoss 上加倍安装(Kamil 可以在这个问题上回答更多),还在家里和 Free Geek Vancouver 进行安装,我在那里做系统管理员工作。这三个程序都会定期崩溃,并且需要重新启动守护程序。
我觉得 Zenoss 很不错,因为它非常稳定并且有更好的 UI,但是它非常耗费资源。
尽管如此,我仍然会选择 Zabbix 来提供监控解决方案,因为 SOP 用于设置新设备的方式更符合我的想法。最好的办法是设置所有这些,看看你最喜欢哪一个。
我们已经使用 Zabbix 超过 4 年了(现在运行 1.6),它甚至还没有崩溃一次(在 RHEL5 上运行)。我过去唯一的抱怨是缺乏文档和友好的支持(谈论免费的社区支持)。我注意到现在有更好的文档。