报警规则类型

  • 单数据源简单规则。简单规则通过对每次最新的监控数据进行阈值比较,来获得报警,比如:
    1. 上下限阈值比较。这种是最简单的,定义好上限和下限,就可以发现异常值
    2. 数据存活性比较。当发现某一监控项的数据存在(或消失)时,即报警,用来检查错误指标(或存活指标)
  • 单数据源组合规则。简单规则产生的报警有可能非常多,我们可以通过对简单规则产生的结果进行进一步的处理,来减少报警量,比如:
    1. 多次报警。当简单规则触发的内部报警在一段时间内超过一定的次数时,才进行真正的报警。
    2. 报警cooldown。当同一报警不停出现时,此规则会进行相应的抑制。
    3. 断崖式报警。当监控数据出现断崖式特征时,才进行报警。
  • 多数据源组合规则。有时候,单一的数据源还不够,需要对多个数据源进行计算后获得,比如:
    1. 同环比报警。对同一监控项可以拉取不同时间段的两条数据,就可以进行相应的报警。
    2. 组合运算报警。比如说nginx 2xx状态比例的监控,可以通过对2xx次数和总访问次数的计算来获取。