动态与公告
- 产品动态
产品简介
- 产品概述
- 产品优势
- 基本功能
- 基本概念
- 应用场景
- 使用限制
购买指南
- 云产品监控
- 应用性能监控
- 终端性能监控
- 前端性能监控
- 云拨测
- Prometheus 监控服务
- Grafana 服务
- 事件总线
- 云压测
快速入门
- 监控概览
- 实例分组
- 云产品监控
- 应用性能监控
- 云拨测
- 云压测
- Prometheus 监控服务
- Grafana 服务
- 创建 Dashboard
- 事件总线
- 告警服务
云产品监控
- 云产品监控指标
- 控制台操作指南
- 云服务器监控组件
- 云产品监控对接 Grafana
- 故障处理
- 实践教程
应用性能监控
- 应用性能监控简介
- 接入指南
- 控制台操作指南
- 实践教程
- 参考信息
- 常见问题
终端性能监控
- 终端性能监控概述
- 控制台操作指南
- 接入指南
- 实践教程
前端性能监控
- 前端性能监控简介
- 控制台操作指南
- 接入指南
- 常见问题
云拨测
- 产品简介
- 控制台操作指南
- 常见问题
云压测
- 云压测概述
- 控制台操作指南
- 实践教程
- JavaScript API 列表
- 常见问题
Prometheus 监控
- Prometheus 监控简介
- 接入指南
- 控制台操作指南
- 实践教程
- Terraform
- 常见问题
Grafana 服务
- 产品简介
- 控制台操作指南
- Grafana 平台常用功能指引
- 常见问题
Dashboard
- 什么是 Dashboard
- 控制台操作指南
告警管理
- 控制台操作指南
- 故障处理
- 常见问题
事件总线
- 事件总线简介
- 控制台操作指南
- 实践教程
- 常见问题
报表管理
常见问题
- 腾讯云可观测平台常见问题
- 告警服务相关
- 一般性问题
- 监控图表相关
- 云服务器监控组件相关
- 动态阈值告警相关
- 云监控对接 Grafana 相关
文档阅读指南
相关协议
- 应用性能监控服务等级协议
- APM 隐私协议
- APM 数据处理和安全协议
- 前端性能监控服务等级协议
- RUM 隐私协议
- RUM 数据处理和安全协议
- 终端性能监控服务等级协议
- 终端性能监控隐私协议
- 终端性能监控数据处理和安全协议
- 云拨测服务等级协议
- Prometheus 监控服务服务等级协议
- Grafana 服务服务等级协议
- 云压测服务等级协议
- 云压测使用限制
- Cloud Monitor Service Level Agreement
API 文档
- History
- Introduction
- API Category
- Making API Requests
- Monitoring Data Query APIs
- Alarm APIs
- Legacy Alert APIs
- Notification Template APIs
- TMP APIs
- Grafana Service APIs
- Event Center APIs
- TencentCloud Managed Service for Prometheus APIs
- Monitoring APIs
- Data Types
- Error Codes
词汇表

告警规则说明

下载

聚焦模式

字号

最后更新时间： 2024-08-07 21:55:37

告警规则允许我们基于 Prometheus 的表达式设定告警条件, 实时监控服务的状态，及时通知触达服务异常情况.
如何定义一个告警规则
在 Prometheus 中，告警规则和聚合规则的定义非常类似，一个告警规则的示例可能如下：
groups:
- name: example
  rules:
  - alert: HighRequestLatency
    expr: job:request_latency_seconds:mean5m{job="myjob"} > 0.5
    for: 10m
    labels:
      severity: page
    annotations:
      summary: High request latency
在告警规则文件中，我们可以将一组相关的规则设置定义在一个 group 下。在每一个 group 中我们可以定义多个告警规则 rule。一条告警规则主要由以下几部分组成：
alert：告警规则的名称。
expr：基于 PromQL 的表达式告警触发条件，用于计算是否有时间序列满足该条件。
for：评估等待时间，可选参数。用于表示只有当触发条件持续一段时间后才发送告警。在等待期间新产生告警的状态为 pending。
labels：自定义标签，允许用户指定要附加到告警上的一组附加标签。
annotations：用于指定一组附加信息，例如用于描述告警详细信息的文字等，annotations 的内容在告警产生时会一同作为参数发送到 Alertmanager。
模板
通常情况，在告警规则文件的 annotations 中使用 summary 描述告警的概要信息，description 用于描述告警的详细信息。同时 Alertmanager 的 UI 也会根据这两个标签值，显示告警信息。为使告警信息具有更好的可读性，Prometheus 支持模板化 label 和 annotations 的中标签的值。
通过 $labels.<labelname> 变量可以访问当前告警实例中指定标签的值。$value 则可以获取当前 PromQL 表达式计算的样本值。
# To insert a firing element's label values:
{{ $labels.<labelname> }}
# To insert the numeric expression value of the firing element:
{{ $value }}
例如，可以通过模板化优化 summary 以及 description 的内容的可读性：
groups:
- name: example
  rules:
﻿
  # Alert for any instance that is unreachable for >5 minutes.
  - alert: InstanceDown
    expr: up == 0
    for: 5m
    labels:
      severity: page
    annotations:
      summary: "Instance {{ $labels.instance }} down"
      description: "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 5 minutes."
﻿
  # Alert for any instance that has a median request latency >1s.
  - alert: APIHighRequestLatency
    expr: api_http_request_latencies_second{quantile="0.5"} > 1
    for: 10m
    annotations:
      summary: "High request latency on {{ $labels.instance }}"
      description: "{{ $labels.instance }} has a median request latency above 1s (current value: {{ $value }}s)"
﻿

帮助和支持

本页内容是否解决了您的问题？

您也可以联系销售或提交工单以寻求帮助。

填写满意度调查问卷，共创更好文档体验。

文档反馈

tencent cloud

腾讯云可观测平台

告警规则说明

如何定义一个告警规则

模板

帮助和支持