监控告警是您在使用日志服务时业务可靠性和可用性的保证。本文档主要示意如何配置 CLS LogListener 心跳告警策略,方便您可以第一时间感知到 LogListener 采集端的异常情况。
操作步骤
步骤1:新增告警策略
1. 登录 腾讯云可观测平台,在左侧菜单栏中,选择告警管理 > 告警配置,进入告警策略页面。 2. 单击新建策略,进入新建策略页面。依次配置以下信息:
策略名称:自定义策略名称。
备注:自定义策略备注。
监控类型:选择云产品监控。
策略类型:搜索并选择日志服务/机器组。
所属标签:选择策略所属标签后,方便您根据标签对策略进行管理。支持为策略关联多个标签。如需创建标签,请参见 创建标签。 告警对象:您可根据实例 ID、实例分组、所有对象筛选告警对象。
实例 ID:根据机器组 ID筛选目标告警对象。
实例分组:根据机器组的分组筛选目标告警对象,您也可以单击新建实例组:
在实例分组页面单击新建。
配置基本信息:自定义分组名,分组类型选择日志服务-机器组,然后勾选您期望的机器组。
单击保存,创建成功。
所有对象:将您的所有机器组作为告警对象。
配置告警触发条件:
日志服务会将机器组的心跳异常/正常数量上报腾讯云可观测平台。在选择监控类型和策略类型后,系统将自动设置对应云产品的告警策略常用触发条件。您也可以自定义配置指标告警,配置说明如下:
|
告警指标 | 您可选择对应云产品的重要指标作为告警指标。 |
统计粒度 | 监控数据采集和分析的时间间隔。 |
阈值 | 指标告警支持静态阈值和动态阈值两种阈值类型。 静态阈值包含固定静态阈值和环比静态阈值,您可根据业务需求选择比较关系和阈值大小。配置指标告警时,将默认选择静态阈值。 动态阈值用于当业务系统具有明显周期性波动或数据呈现突增突降趋势。 |
告警分级 | 您选择启用告警分级功能后,支持设置紧急、严重、提示三种级别告警。当前告警分级功能仅支持云产品监控和应用性能监控类型。 |
持续监控数据点 | 您可选择持续监控多少个数据点后产生告警。 |
告警频率 | 当告警产生时,您可以定义告警以特定的频率重复通知。告警通知频率包含指定频率重复通知和按周期指数递增通知。 指定频率重复通知:若24小时内告警未恢复,系统会按您配置的频率(每1小时、2小时等)发送告警;告警超过24小时未恢复,每天告警一次。(若告警已恢复,重复通知周期将会重新计算。) 注意: 若告警频率配置为“只告警一次”,则在告警生命周期中只会在告警首次触发和告警恢复时分别发送一次通知。 按周期指数递增通知:以5min固定周期为底数,按指数(1、2、3......)的递增间隔区间发送告警通知。告警信息发送时长间隔将越来越长,一定程度上避免重复告警对您的骚扰。 |
判断条件 | 多个告警触发条件支持按照任意/所有/复合形式进行判断,判断条件如下。 任意:任意一条触发条件到达阈值时触发告警 所有:所有触发条件均到达阈值时触发告警 复合:满足复合告警条件时触发告警,支持 AND/OR 组成的复合告警规则。 |
例1:当出现心跳异常数 > =1 时,并持续2个统计周期(统计周期为1分钟),则触发告警,告警策略为每五分钟告警一次。
例2:当出现心跳正常数 < 100 时,并持续2个统计周期(统计周期为1分钟),则触发告警,告警策略为每五分钟告警一次。
3. 配置完成后,单击下一步。
步骤2:配置告警通知
您可选择或新建通知模板用于接收告警信息,新建模板可参考 新建通知模板。 注意:
告警渠道指定告警联系人(可以指定接收组),当且仅当接收人的手机、邮箱已验证的前提下,才可以正常接收到告警信息。
步骤3:接收告警
腾讯云会根据所配置的告警策略进行监控,当满足触发条件时,会通过告警渠道发送告警信息。
步骤4:查看告警历史
2. 在左侧菜单栏中选择告警管理 > 统计大盘,可以查看告警大盘。在查看告警详情中可以查看触发告警的历史信息,包括告警触发的开始时间、持续时间等详情。