警报消息的默认格式是:
** 恢复主机警报:服务器已启动 ** ***** 纳吉奥斯 ***** 通知类型:恢复 主机:服务器 状态:上 地址:server.ru 信息:PING OK - 数据包丢失 = 0%,RTA = 26.00 ms 日期/时间:2009 年 8 月 13 日星期四 17:08:16 MSD
我想用最少的字母获得最多的信息。首先,能够从短信中获取信息。其次,在 90% 的情况下只阅读电子邮件的标题。
例如,前面的消息可以只是“ H: server is UP
”,其中 H 代表Host Alert
。如果此服务器已关闭,我想收到这样的消息:[!] H: server is DOWN
.
而不是消息,“服务器上的交换使用情况很严重”我想得到“[!] S:服务器/交换使用率 > 50%”,其中 50 是从用于 check_swap 的 nagios 配置中获取的,而不是硬编码到消息中。
如果“Router/wan2 is CRITICAL”,我想查看“ADSL 通道已关闭”。
因此,总而言之,我想分别为每个服务及其状态自定义消息,并能够在文本中使用插件参数。
我怎样才能做到这一点?
Nagios 可以配置为通过各种方式和各种格式发送通知。如果您需要个性化,请参阅您的 commands.cfg。
这是一个示例,向您展示如何使用 gnokii 通过短信接收简短通知:
输出是这样的“主机名已启动”
有几个用于 nagios 的聚合插件,除了允许您指定较短的警报外,还会将多个警报合并到 1 页中,这样当很多事情同时发生时,您不会被分页 200 次。
两个好的是:
来自 nans 的警报看起来像这样(但当然可以自定义)
此外,如果您需要更大的灵活性,请考虑在 nagios 和您之间放置一个 bash 脚本。这可以让您以更大的灵活性发送消息,例如,您不希望将恢复电子邮件发送给您的自动工单创建者。