Mez Asked: 2009-06-02 13:28:47 +0800 CST2009-06-02 13:28:47 +0800 CST 2009-06-02 13:28:47 +0800 CST 监控解决方案 [重复] 772 可能重复: 您使用什么工具来监控您的服务器? 您使用哪些应用程序来监控您的服务器,它们监控什么? 我对 last.fm 的一些显示器印象深刻 monitoring alerts 9 个回答 Voted chaos 2009-06-02T13:31:09+08:002009-06-02T13:31:09+08:00 Nagios:内部系统指标和可用性 Cacti:网络性能和负载,内部系统指标 AlertSite:外部服务可用性 David Pashley 2009-06-02T14:38:09+08:002009-06-02T14:38:09+08:00 我们使用 nagios 进行监控和警报,使用 Munin 进行系统绘图。 Nagios 虽然并不完美,而且配置起来很痛苦,但它可以满足我们的大部分需求。 Munin 是我见过的最简单的绘图系统。它是 rrdtool 的另一个包装器,但没有任何痛苦。启动并运行某些东西需要 5 分钟。添加新图表也很简单。 Mike Messina 2009-06-02T13:36:32+08:002009-06-02T13:36:32+08:00 我们使用 IPSWITCH WhatsUpGold - 它非常适合我们并且易于使用。 Mike Fiedler 2009-06-02T13:48:11+08:002009-06-02T13:48:11+08:00 我使用以下组合: Nagios,包括通过 NRPE for Linux/NSCP for Windows 进行远程检查;Ganglia,收集系统级统计信息 整体端到端服务的外部测试是通过 Pingdom。 我们监控一些基本的系统内容——cpu 负载、可用空间、内存。我们还开发了一些类似模板的检查,允许我们轻松添加新服务器,并且它将继承所有现有的监控检查,仅基于其组成员身份。 最初的部署有点困难,但现在非常顺利,而且由于它是集中的并且可以“集群”(在一定程度上),我们计划替换我们所有的本地“monit”安装。 kabs 2009-06-02T13:56:55+08:002009-06-02T13:56:55+08:00 对于快速设置和有限数量的服务器(我有 40 个),Munin 是一个不错的选择。 你应该编写脚本来监控更多的经典服务(cpu、内存、网络、磁盘等)吗? Kevin Colby 2009-06-02T14:02:16+08:002009-06-02T14:02:16+08:00 System Center Operations Manager:Windows 系统和服务的运行状况监控。还具有一些新的跨平台功能。还使用 3rd 方解决方案进行安全健康监控。 mjefferson 2009-06-02T15:05:21+08:002009-06-02T15:05:21+08:00 另一个不错的选择是 Servers Alive。我已经在许多不同的环境中使用它并取得了很大的成功。它易于设置且灵活。 Shawn Anderson 2009-06-02T19:49:24+08:002009-06-02T19:49:24+08:00 性能计数器监视器 心跳 事件簿 磁盘驱动器 这取决于你需要什么。对于上述内容,我们使用我们自己的产品(Admin Arsenal)。 如果您正在寻找应用程序监控(Active Directory、Exchange、MS-SQL),那么Quest Software是一个不错的选择。 如果您需要监控您的公司网站,您可以尝试使用HP SiteScope(以前称为 Mercury SiteScope)。还有大量的网站托管监控解决方案。 这还取决于警报响起时您想要做什么。您需要采取纠正措施吗?您希望如何收到警报?大多数应用程序都支持电子邮件,但您是否需要将警报发送到托管对象等控制台,或者使用您的帮助台软件打开帮助台工单?如果您需要其中一些东西,那么您可能正在市场上购买诸如 IBM Tivoli 或 Microsoft Systems Center 之类的大型枪支产品。它们会花费你一分钱,但它们非常强大且可定制。 sysadmin1138 2009-06-02T20:50:29+08:002009-06-02T20:50:29+08:00 我们广泛使用Intermapper。我们的电信集团得到了它,但它很快扩展到了统一的服务器/网络监控工具。我们甚至为它编写了一些自定义探针。
我们使用 nagios 进行监控和警报,使用 Munin 进行系统绘图。
Nagios 虽然并不完美,而且配置起来很痛苦,但它可以满足我们的大部分需求。
Munin 是我见过的最简单的绘图系统。它是 rrdtool 的另一个包装器,但没有任何痛苦。启动并运行某些东西需要 5 分钟。添加新图表也很简单。
我们使用 IPSWITCH WhatsUpGold - 它非常适合我们并且易于使用。
我使用以下组合:
Nagios,包括通过 NRPE for Linux/NSCP for Windows 进行远程检查;Ganglia,收集系统级统计信息
整体端到端服务的外部测试是通过 Pingdom。
我们监控一些基本的系统内容——cpu 负载、可用空间、内存。我们还开发了一些类似模板的检查,允许我们轻松添加新服务器,并且它将继承所有现有的监控检查,仅基于其组成员身份。
最初的部署有点困难,但现在非常顺利,而且由于它是集中的并且可以“集群”(在一定程度上),我们计划替换我们所有的本地“monit”安装。
对于快速设置和有限数量的服务器(我有 40 个),Munin 是一个不错的选择。
你应该编写脚本来监控更多的经典服务(cpu、内存、网络、磁盘等)吗?
System Center Operations Manager:Windows 系统和服务的运行状况监控。还具有一些新的跨平台功能。还使用 3rd 方解决方案进行安全健康监控。
另一个不错的选择是 Servers Alive。我已经在许多不同的环境中使用它并取得了很大的成功。它易于设置且灵活。
这取决于你需要什么。对于上述内容,我们使用我们自己的产品(Admin Arsenal)。
如果您正在寻找应用程序监控(Active Directory、Exchange、MS-SQL),那么Quest Software是一个不错的选择。
如果您需要监控您的公司网站,您可以尝试使用HP SiteScope(以前称为 Mercury SiteScope)。还有大量的网站托管监控解决方案。
这还取决于警报响起时您想要做什么。您需要采取纠正措施吗?您希望如何收到警报?大多数应用程序都支持电子邮件,但您是否需要将警报发送到托管对象等控制台,或者使用您的帮助台软件打开帮助台工单?如果您需要其中一些东西,那么您可能正在市场上购买诸如 IBM Tivoli 或 Microsoft Systems Center 之类的大型枪支产品。它们会花费你一分钱,但它们非常强大且可定制。
我们广泛使用Intermapper。我们的电信集团得到了它,但它很快扩展到了统一的服务器/网络监控工具。我们甚至为它编写了一些自定义探针。