我有几个输出指标的设备。如果指标高于阈值(每个设备不同),我会发出警报。在我的文件末尾,alert_rules.yml
我有一个包罗万象的内容,它会针对任何输出指标值 >1 的设备发出警报。这是为了查找可以在规则文件中较早添加其单独规则的设备(设备可能会出现和消失)。
我遇到的问题是,所有设备都会触发此 >1 识别规则。即使是上面定义了规则的规则(如预期的那样)。如何确保设备仅触发其自己的规则(及其自定义限制)或识别规则,而不是同时触发两者?
我有几个输出指标的设备。如果指标高于阈值(每个设备不同),我会发出警报。在我的文件末尾,alert_rules.yml
我有一个包罗万象的内容,它会针对任何输出指标值 >1 的设备发出警报。这是为了查找可以在规则文件中较早添加其单独规则的设备(设备可能会出现和消失)。
我遇到的问题是,所有设备都会触发此 >1 识别规则。即使是上面定义了规则的规则(如预期的那样)。如何确保设备仅触发其自己的规则(及其自定义限制)或识别规则,而不是同时触发两者?
您有两种一般方法可以做到这一点:
从捕获所有规则中排除已计入的设备。
根据您的系统结构,这可能很容易或很困难(或者有时几乎无法实现),但如果没有您的规则的示例,就很难提供更多细节。在最简单的情况下,最后一个警报的表达式将如下所示:
启用
<inhibit_rule>
该选项将使已触发警报的设备的所有警报静音正如文档所解释的
所以在你的情况下它会是这样的
catch-em-all
如果名称与正则表达式模式匹配device.*-threshold
且相同标签的警报已经触发,这将使名称的警报静音device
。使用前请调整您的姓名。