所以,我使用 munin 来监控几百台服务器,我喜欢它。我正在尝试调整警报文本以使其看起来有些不同,但我不明白如何让它做我想做的事。
我已阅读http://guide.munin-monitoring.org/en/latest/tutorial/alert.html和http://munin-monitoring.org/wiki/MuninAlertVariables并且变量等没有问题。我想改变语法。更具体地说,这是 perl 模块中的默认文本格式:
'${var:group} :: ${var:host} :: ${var:graph_title}${if:cfields \n\tCRITICALs:${loop<,>:cfields ${var:label} is ${var:value} (outside range [${var:crange}])${if:extinfo : ${var:extinfo}}}.}${if:wfields \n\tWARNINGs:${loop<,>:wfields ${var:label} is ${var:value} (outside range [${var:wrange}])${if:extinfo : ${var:extinfo}}}.}${if:ufields \n\tUNKNOWNs:${loop<,>:ufields ${var:label} is ${var:value}${if:extinfo : ${var:extinfo}}}.}${if:fofields \n\tOKs:${loop<,>:fofields ${var:label} is ${var:value}${if:extinfo : ${var:extinfo}}}.}\n',
如上述文件所述,这将输出如下内容:
dev :: hostname.dev :: 内存使用正常:swap 为 779112448.00。
我目前已将格式重写为:
${if:cfields CRITICAL} ${if:wfields WARNING} ${if:fofields OK} '${var:group} :: ${var:host} :: ${var:graph_title}\n${if:cfields CRITICAL :${loop<,>:cfields ${var:label} is ${var:value} (outside range [${var:crange}])${if:extinfo : ${var:extinfo}}}.\n\t}${if:wfields WARNING :${loop<,>:wfields ${var:label} is ${var:value} (outside range [${var:wrange}])${if:extinfo : ${var:extinfo}}}.\n\t}${if:ufields UNKNOWN :${loop<,>:ufields ${var:label} is ${var:value}${if:extinfo : ${var:extinfo}}}.\n\t}${if:fofields OK :${loop<,>:fofields ${var:label} is ${var:value}${if:extinfo : ${var:extinfo}}}.}'
这背后的原因是我希望严重性按照最严重到最不严重的顺序首先出现。
输出最终看起来像这样,然后我可以很好地按严重性过滤消息。:
'CRITICAL':'dev :: hostname.dev :: 内存使用 CRITICAL : 交换为 1706340352.00(超出范围 [:1000000000])。
就严重性而言,这是我想要的“功能”,但我想让它更漂亮,因为一些消息同时带有 CRITICAL 和 WARNING 和 OK,最终看起来像这样:
'警告':'OK dev :: hostname.dev .....
我知道为什么会这样,我的格式中的逻辑是“如果有 cfield,则输出 CRITICAL。然后如果有 wfield,则输出 WARNING ...”等。我希望它只输出三个中最严重的一个而不是2 或全部三个,如果它们都存在的话。
在我的大脑中,我可以想出它的逻辑(如果有 cfields,则输出 CRITICAL,如果没有 cfields,并且有 wfields,则输出 WARNING,如果没有 cfields 或 wfields,但有 fofields,然后输出OK。)但是,我不知道这是用什么格式方法或语言编写的。 Munin 程序都是用 Perl 编写的,但是我在网上找不到任何在 Perl 或任何其他语言中引用此语法的东西(我的google fu今天一定不强)。
那么,有人知道如何在这里帮助我吗?TLDR,在这种语法中(其中 ${if:cfields CRITICAL} 表示如果 cfields 存在,则打印 CRITICAL)正确的写法是:如果 cfields 不存在且 wfields 存在则打印警告。
TIA
扩展的允许语法可以在
message_expand
函数中看到LimitsOld.pm
。据我所知,它没有实现足够的控制结构来做你想做的事。另一种方法是通过中介(例如 Nagios 或您自己设计的脚本)传递通知并在那里应用逻辑/重新格式化。