我正在考虑设置一个工具,用于从各种平台上的多个系统收集使用数据和 KPI。我们希望定期报告有关系统使用情况和运行状况的关键指标。它不需要实时监控每月的性能和使用指标。
输入的系统将多种多样,从运行大型 ERP 应用程序的 Solaris 盒子到运行我们内部网的 IIS。我们会同意每个 2-5 kpi,然后编写某种脚本来从每个系统中提取数据。数据会有所不同,从用户名的使用情况、应用程序的使用情况到性能数据(例如每个站点的响应时间)。
是否有现成的应用程序用于存储和报告各种指标?
就我而言,它需要免费便宜,否则我们将自己创建和维护一个小型数据库。
看看波利蒙。 http://polymon.codeplex.org
从你的描述来看,这正是你所追求的。
并且免费。
“是否有任何现成的应用程序可用于存储和报告各种指标?”
你的操作系统?:)
指标数据是否由简单的数字组成,您的脚本可以理解其语义?SNMP 可以从跨平台系统中提取各种数据,但您必须为不在通常 MIB 中的任何内容指定 exec 调用。
正如您所说,我认为自定义方法是最适合您的方法,只需一些脚本和一个数据库。
有许多不同的商业监控工具,HP OpenView Operations 特别是性能监控器会为您的目的而出现,但它们都非常昂贵。我认为你应该首先不要说你想要什么,而是说你希望实现什么:“我们希望定期报告有关系统使用情况和健康状况的关键指标”。您是否正在查看您环境中服务器的硬件运行状况?HP SIM 或其他基于 SNMP 的工具将适用于此。您是否正在寻找 CPU 使用率、硬盘空间、网络使用率等系统重要统计数据?对于 linux 你想要 sar,collectd。对于 Windows,您可以通过 SNMP 获得这些统计信息。
根据您的环境,集中监控应用程序性能和运行状况而不是底层操作系统可能更合适。CPU、网络尖峰是粗略的衡量标准,在复杂的环境中它不一定是你关心的。首先衡量您的每秒交易量,以便了解您是否有问题需要调查。
查看像 splunk 这样的日志监控工具可能是合适的,因为您的系统通常会告诉您是否有问题。同样,这取决于您真正想要实现的目标。
OVO 可能是可以满足您需求的工具,但它很昂贵。对于开源工具,请查看 cacti、nagios 和 collectd。