tencent cloud

腾讯云可观测平台

动态与公告
产品动态
产品简介
产品概述
产品优势
基本功能
基本概念
应用场景
使用限制
购买指南
云产品监控
应用性能监控
终端性能监控
前端性能监控
云拨测
Prometheus 监控服务
Grafana 服务
事件总线
云压测
快速入门
监控概览
实例分组
云产品监控
应用性能监控
云拨测
云压测
Prometheus 监控服务
Grafana 服务
创建 Dashboard
事件总线
告警服务
云产品监控
云产品监控指标
控制台操作指南
云服务器监控组件
云产品监控对接 Grafana
故障处理
实践教程
应用性能监控
应用性能监控简介
接入指南
控制台操作指南
实践教程
参考信息
常见问题
终端性能监控
终端性能监控概述
控制台操作指南
接入指南
实践教程
前端性能监控
前端性能监控简介
控制台操作指南
接入指南
常见问题
云拨测
产品简介
控制台操作指南
常见问题
云压测
云压测概述
控制台操作指南
实践教程
JavaScript API 列表
常见问题
Prometheus 监控
Prometheus 监控简介
接入指南
控制台操作指南
实践教程
Terraform
常见问题
Grafana 服务
产品简介
控制台操作指南
Grafana 平台常用功能指引
常见问题
Dashboard
什么是 Dashboard
控制台操作指南
告警管理
控制台操作指南
故障处理
常见问题
事件总线
事件总线简介
控制台操作指南
实践教程
常见问题
报表管理
常见问题
腾讯云可观测平台常见问题
告警服务相关
一般性问题
监控图表相关
云服务器监控组件相关
动态阈值告警相关
云监控对接 Grafana 相关
文档阅读指南
相关协议
应用性能监控服务等级协议
APM 隐私协议
APM 数据处理和安全协议
前端性能监控服务等级协议
终端性能监控服务等级协议
云拨测服务等级协议
Prometheus 监控服务服务等级协议
Grafana 服务服务等级协议
云压测服务等级协议
云压测使用限制
Cloud Monitor Service Level Agreement
词汇表

告警触发条件简介

PDF
聚焦模式
字号
最后更新时间: 2024-11-12 12:43:43
告警触发条件是指标、比较关系、阈值、统计粒度和持续 N 个监控数据点组成的一个有语义的条件,用户可以根据图表中指标变化趋势设置告警触发条件。例如,指标为 CPU 利用率 、比较关系为 > 、阈值为80% 、统计粒度为5分钟 、持续监控数据点为2个数据点,表示每5分钟收集一次 CPU 利用率数据,若某台云服务器的 CPU 利用率连续两次大于80%则触发告警。
腾讯云可观测平台支持用户自定义配置指标告警事件告警,同时提供告警触发条件模板功能,支持用户快速复用预置的告警触发条件。

告警触发逻辑说明

告警生命周期解析

指标在持续 N 个数据点达到阈值即是⼀次告警⽣命周期的开始,在告警未恢复前,将根据配置的发送频率发送告警消息(若24小时内告警未恢复,系统会按您配置的频率例如:每1小时、2小时等发送告警;告警超过24小时未恢复,则每天告警一次);如果告警恢复,您将会收到恢复消息,本次告警⽣命周期结束。再次触发则进⼊新的告警周期。

告警生命周期示意图

静态阈值

以3个监控数据点持续大于阈值即触发为例: 下图为一个告警生命周期,当持续三个监控数据点(如下图三个红点)达到阈值后触发告警,红色线段为告警时间段,此段时间会根据您设置的频率发送告警通知;当持续三个监控数据点(如下图三个绿色点)恢复正常后告警恢复,停止发送告警消息。即告警生命周期结束,需要再次持续三个监控数据点达到阈值才会触发告警。




静态阈值(环比)

静态阈值(环比)包含环比上升环比下降环比波动三种比较关系,计算方式如下所示:
环比上升:与前一个监控数据点相比,持续 n 个数据点的增长率大于阈值,其中增长率 = (当前数据值-上个数据值) / 上个数据值。
环比下降:与前一个监控数据点相比,持续 n 个数据点的下降率大于阈值,其中下降率 = (上个数据值-当前数据值) / 上个数据值。
环比波动:与前一个监控数据点相比,持续 n 个数据点的变化率绝对值大于阈值,其中变化率绝对值 = | (当前数据值-上个数据值) / 上个数据值 | 。
以3个监控数据点持续环比上升达到阈值即触发为例: 环比上升表示本统计周期与上一统计周期相比持上升状态。当持续三个监控数据与前一个监控数据点相比,增长率大于阈值时触发告警(如下图第一个红点和前一个蓝点相比上升 N%,以此类推)。
红色线段为持续满足环比上升条件,处于告警时间段。当持续三个监控数据点不满足环比上升(第一个绿点和第三个绿点相比前一个数据点,呈下降趋势),或处于环比上升但环比增长率达不到阈值,告警恢复正常,停止发送告警消息。



静态阈值(同比)

静态阈值(同比)包含同比昨天波动、同比昨天上升、同比昨天下降、同比上周波动、同比上周上升同比上周下降六种比较关系,计算方式如下所示:
同比昨天上升:与昨天相同时间数据点相比,持续n个数据点的增长率大于阈值,其中增长率= (当前数据值-昨天相同时间数据值) / 昨天相同时间数据值 。
同比昨天下降:与昨天相同时间数据点相比,持续n个数据点的下降率大于阈值,其中下降率= (昨天相同时间数据值-当前数据值) / 昨天相同时间数据值 。
同比昨天波动:与昨天相同时间数据点相比,持续n个数据点的变化率绝对值大于阈值,其中变化率绝对值=| (当前数据值-昨天相同时间数据值) / 昨天相同时间数据值 | 。
同比上周上升:与上周相同时间数据点相比,持续n个数据点的增长率大于阈值,其中增长率= (当前数据值-上周相同时间数据值) / 上周相同时间数据值 。
同比上周下降:与上周相同时间数据点相比,持续n个数据点的下降率大于阈值,其中下降率= (上周相同时间数据值-当前数据值) / 上周相同时间数据值 。
同比上周波动:与上周相同时间数据点相比,持续n个数据点的变化率绝对值大于阈值,其中变化率绝对值=| (当前数据值-上周相同时间数据值) / 上周相同时间数据值 | 。
以3个监控数据点同比昨天上升达到阈值即触发为例:
同比上升表示本统计周期与昨天相同时间统计周期相比持上升状态。当持续三个监控数据与昨天相同时间监控数据点相比,增长率大于阈值时触发告警(如下图第一个红点和昨天同一时间的数据点相比上升 N%,以此类推)。
红色线段为持续满足同比昨天上升条件,处于告警时间段。当持续三个监控数据点不满足同比昨天上升(第一个绿点和第三个绿点相比昨天相同数据点,呈下降趋势),或处于同比昨天上升但同比增长率达不到阈值,告警恢复正常,停止发送告警消息。




动态阈值

以3个监控数据点持续达到阈值即触发为例: 如下图当持续三个监控数据点不满足监控数据历史变化规律后触发告警,红色线段为持续不满足历史变化规律,处于告警时间段。当持续三个数据点恢复监控数据历史变化规律后告警恢复正常,停止发送告警消息。




帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈