流计算 Oceanus 的数值指标监控告警策略是通过腾讯云可观测平台服务来实现的。本文针对一些常见的场景进行描述,更多详情可参见腾讯云可观测平台官方文档的 告警概述。 注意
腾讯云可观测平台目前已关闭事件告警的配置能力,现在该功能已逐步迁移到 EventBridge,请参见 配置作业事件告警(异常事件) 文档来配置各类异常事件的告警。 查看作业告警策略
在 腾讯云可观测平台控制台 中选择告警管理 > 策略管理,默认可以查看所有产品的告警策略配置。在页面右上角搜索框中输入“流计算 Oceanus”,即可查看所有为流计算作业配置的告警项。 新增作业告警策略
2. 在策略类型下拉框中选择“流计算 Oceanus”,即提示选择“告警对象”。这里可以针对特定作业,或者所有作业进行策略配置,按 Shift 键即可多选。
3. 告警对象选择完毕,可选择“触发条件”。在 触发条件模板 中选择已经配置好的模板,或者新增模板。另外,如果不需要使用模板,则可以选择“配置触发条件”,这里可以对上述的多项监控指标做阈值配置和告警。 4. 选择告警渠道,设置接收对象、有效时段、接收渠道和接收语言等信息,并配置接口回调(可选)。
5. 当所有内容配置完毕,单击完成,新建告警策略即立刻生效。
注意
“作业重启次数”和 “checkpoint 失败总次数”指标是累加型指标,配置监控告警的时候请使用环比的告警策略。
作业按标签配置告警
标签键和标签值,单击确定。
2. 在创建作业或作业概览中选择标签。
作业概览页面中编辑标签:
编辑标签后单击确定即可。
4. 配置告警通知。