参考:http://bosun.org/usage
bosun用法:
用法
本部分文档涵盖在定义配置和警报后使用bosun。
警报和事件
概述
每个警报定义都有可能变成多个事件(警报的实例化)。 事件获得唯一的全局ID,并且还与Alery Key相关联。 警报键由警报名称和标记集组成。 您的顶级表达式中的每个可能的组都会独立计算。 例如,使用类似avg(q(“avg:rate {counter ,, 1}:os.cpu {host = *}”,“5m”,“”)的表达式),您可以创建一个事件 对于已发送os.cpu指标数据的“主机”标记键的每个标记值。
事件的生命周期
当warn或crit表达式变得非零,或者警报未知时,将创建事件。一旦创建了事件,它将仅在事件的生存期严重性增加时通知用户。例外情况是,如果您设置了通知链,在这种情况下,警报将发送更多通知,直到有人确认警报。
例
您有一个名为high.cpu的警报定义,它有警告表达式像avg(q(os.cpu {host = *} ...))> 50。您的主机之一(web01)触发警报的警告条件
我们现在有一个事件,事件将获得一个全局ID,如#23412,并将有一个警报键high.cpu {host = web01},并将有一个当前的严重性状态警告。假设已设置通知,将发送通知(即电子邮件)
事件然后恢复到正常的严重性,然后再次警告。发生这种情况时,不会发送通知。重要的是注意,通知仅在事件的生存期严重性增加时发送。事件的生命期持续直到警报已经关闭 - 这通常由用户完成。
事件可以在其返回正常状态时关闭。事件关闭后,可以为同一个警报键(high.cpu {host = web01})创建新的事件。
严重性状态