tencent cloud

数据开发治理平台 WeData

产品动态
动态发布记录(2026年)
产品简介
产品概述
产品优势
产品架构
产品功能
应用场景
购买指南
计费概述
产品版本购买说明
执行资源购买说明
购买方式
欠费说明
退费说明
准备工作
账号和权限管理概述
添加白名单/安全组(可选)
通过 Microsoft Entra ID(Azure AD)单点登录(SSO)WeData
操作指南
管理控制台
项目管理
数据集成
Studio
数据开发
数据分析
数据科学
数据治理(with Unity Semantics)
API 文档
History
Introduction
API Category
Making API Requests
Smart Ops Related Interfaces
Project Management APIs
Resource Group APIs
Data Development APIs
Data Asset - Data Dictionary APIs
Data Development APIs
Ops Center APIs
Data Operations Related Interfaces
Data Exploration APIs
Asset APIs
Metadata Related Interfaces
Task Operations APIs
Data Security APIs
Instance Operation and Maintenance Related Interfaces
Data Map and Data Dictionary APIs
Data Quality Related Interfaces
DataInLong APIs
Platform Management APIs
Data Source Management APIs
Data Quality APIs
Platform Management APIs
Asset Data APIs
Data Source Management APIs
Data Types
Error Codes
WeData API 2025-08-06
服务等级协议
相关协议
隐私协议
数据处理和安全协议
联系我们
词汇表

任务告警

PDF
聚焦模式
字号
最后更新时间: 2026-01-08 10:42:23

告警规则

告警规则页面提供了告警任务的配置功能,支持对项目、任务、工作流的运行情况进行告警条件、告警通知的配置。

新增规则

2. 单击左侧菜单中的项目列表,找到需要配置告警规则的目标项目。
3. 选择项目后,单击进入运维中心模块。
4. 单击左侧菜单中的告警规则。
5. 进入告警规则管理页面,单击新建规则,填写规则信息。

功能描述

信息
描述
基本信息
规则名称
告警规则名称,1 - 128字符,仅限中文、英文、数字和下划线。
规则描述
告警规则描述,非必填,不超过500字符。
监控对象
选择需要进行规则告警的监控对象,目前支持的监控对象为任务和项目。
选择任务为配置对象时,可以通过计算任务、工作流、项目三种途径为任务配置告警规则。
选择项目为配置对象时,通过勾选项目为其配置告警规则。
选择任务为监控对象时,配置告警规则的方式为:
按任务配置:单击添加按钮,可以在弹出对话框中勾选编排空间中已提交运维的计算任务节点,为其配置告警规则。



按工作流配置:单击添加按钮,可以在弹出对话框中勾选编排空间中已提交运维的工作流,为工作流内的计算任务配置告警规则。提供白名单能力,工作流中的计算任务添加进入白名单后,白名单任务将不受告警规则监控。



按项目配置:单击添加按钮,可以在弹出对话框中勾选当前项目中编排空间已提交运维的计算任务,为其设置告警规则。提供白名单能力,计算任务添加进入白名单后,白名单任务将不受告警规则监控。



选择项目为监控对象时,配置告警规则的方式为:
按项目配置:单击添加按钮,可以在弹出对话框中勾选当前用户加入的项目(非访客),为其设置告警规则。用户可以同时勾选多个项目进行监控,后续告警条件在判定时,会将所选项目对应的监控值加和后进行判定。
告警条件(监控对象为项目)
当天失败实例数向上波动率(较近7天均值)
以波动率和当天累计失败实例数作为条件,依据输入周期数内连续或累计满足条件次数判定是否告警。

波动率计算公式为:
(当前时刻当天失败实例数 - 同一时刻近7天失败实例数均值) / 同一时刻近7天失败实例数
若此数值同时为以下两种状态则满足告警条件:
1. 平均值为正数
2. 超过设置阈值
当天失败实例数向下波动率(较近7天均值)
以波动率和当天累计失败实例数作为条件,依据输入周期数内连续或累计满足条件次数判定是否告警。

波动率计算公式为:
(当前时刻当天失败实例数 - 同一时刻近7天失败实例数均值) / 同一时刻近7天失败实例数
若此数值同时为以下两种状态则满足告警条件:
1. 平均值为负数
2. 绝对值超过设置阈值
告警条件
(监控对象为离线任务)
运行失败
被监控的任务生成实例运行失败时进行告警,支持针对周期执行或补录、重跑执行进行配置。可以选择“所有重试完成后失败”或“第一次运行失败”的规则触发条件。
所有重试完成后失败:根据计算任务调度策略中针对任务执行失败的情况,如果有失败重试的相关配置,则按照失败重试的次数执行后,实例均运行失败时,触发告警规则。
第一次运行失败:根据计算任务调度策略,第一次生成的实例运行失败后,触发告警规则。


运行超时
被监控的任务生成实例调度或运行超出预设时间时进行告警,支持针对周期执行或补录、重跑执行进行配置。可以对“任务运行耗时”、“任务完成时间”、“任务等待总耗时”和“任务在周期内未完成”这四个关键时间要求设置规则触发条件。
任务运行耗时:选择任务运行耗时(周期)表示从任务周期运行开始时间计算,超过阈值未完成则触发告警。选择任务运行耗时(重跑、补录)表示从任务补录、重跑运行开始时间计算,超过阈值未完成则触发告警。可以使用“固定值”或“历史均值”来作为告警条件。
固定值:在指定的小时分钟耗时要求时间内,实例未执行完成,则触发告警规则。
历史均值:取计算任务最近10次成功运行的实例运行耗时,再去除最大和最小值后取平均值,不足10次时设置无效。

任务完成时间(周期):从任务实例运行开始时间进行计算,未在规定时间点完成则触发告警。可以使用“固定值”或“历史均值”来作为告警条件。
固定值:在指定的小时/分钟时间点前,实例未执行完成,则触发告警规则。
历史均值:取计算任务最近10次成功运行的实例运行耗时,再去除最大和最小值后取平均值,不足10次时设置无效。

任务等待总耗时:选择任务等待总耗时(周期)表示任务定时时间到调度运行开始时间的间隔时间,超过阈值未运行则触发告警。选择任务等待总耗时(重跑、补录)表示任务的重跑和补录实例从提交时间到调度运行开始时间的间隔时间,超过阈值未运行则触发告警。可以使用“固定值”或“历史均值”来作为告警条件。
固定值:在指定的小时分钟耗时要求时间内,实例未开始运行,则触发告警规则。
历史均值:取计算任务最近10次成功运行的实例等待耗时,再去除最大和最小值后取平均值,不足10次时设置无效。

任务在周期内未完成(周期):任务实例在其当前运行周期内未运行完成时触发告警,周期=间隔*周期单位,例如:
分钟任务:15分间隔任务,则周期为15分钟,如果任务运行超过15分钟未完成则告警。
小时任务:指定小时或间隔为1时,则周期均为1小时;间隔为2,则周期为2小时,依此类推。
天、周、月和年任务:周期均为1天。

运行成功
被监控的任务生成实例运行成功时进行告警,支持针对周期执行或补录、重跑执行进行配置。
告警条件
(监控对象为实时任务)
数据流入/流出时间间隔
实时任务告警仅支持在最新版本标准Spark引擎上生效,如需升级引擎请提交DLC工单
当实时任务(DLC Spark Streaming)在预设时间内,流入/流出数据量持续为 0 时,系统将触发告警。告警推送的最小间隔,遵循配置的告警触发频率执行。
告警触发频率可配置范围:5-1440分钟

重试次数
实时任务告警仅支持在最新版本标准Spark引擎上生效,如需升级引擎请提交DLC工单
当实时任务(DLC Spark Streaming)在预设时间内,重试次数超过了预设值,系统触发告警。告警推送的最小间隔,遵循配置的告警触发频率执行。
告警触发频率可配置范围:5-1440分钟

告警通知
告警级别
根据不同告警类型的告警级别,区分告警信息发送内容,目前提供普通、重要、紧急三种告警类型选择。



告警方式
告警规则触发后,告警信息的发送渠道。目前支持邮件、短信、微信、电话、企业微信、HTTP、企业微信群、飞书群、钉钉群、Slack 群、Teams 群等推送方式。手机、微信、邮件等账号可以在腾讯云个人中心 > 访问管理 > 用户模块中配置,企业微信账号在腾讯云个人中心 > 访问管理 > 联合账号中配置。企业微信群、飞书群、钉钉群、Slack群和Teams群只能选择一个。

告警接收人
告警规则触发后,会向接收人发送告警信息,目前支持“指定人员”、“任务责任人”、“值班表”三种方式设置告警规则触发后的告警信息接收人。
指定人员:可以指定任意的一个或多个用户作为告警信息接收人。
任务责任人:将计算任务的责任人作为告警信息接收人。
值班表:将已排班的值班表作为接收人,向值班用户发送告警信息。值班表中的用户在告警信息中为某条告警信息单击确认告警后,同一值班表下的用户将不再接收此条告警的消息。

告警升级人
在告警接收人选择指定人员或任务负责人选项时,支持添加告警升级人。告警升级人支持通过下拉框添加项目内成员,最多添加5人。
如果告警接收人或上级升级人在告警间隔时间内未在运维中心的告警信息中确认该条告警,则系统会将告警发送给下一级升级人。告警升级人的上下级顺序依据配置时的上下位置确定。

通知频率
支持定义一次告警的发送次数,及每次发送消息之间的间隔时间。若至少配置了一个告警升级人,则不支持配置通知频率,仅显示告警间隔。

通知免打扰
支持设置通知的免打扰时间,免打扰时段内告警将不会发送,用户可以在告警信息中查看到告警记录。
免打扰支持按照星期、时间进行配置,支持配置多段免打扰时间。

添加告警接收配置
告警接收配置可以添加多组,为不同的接收人配置不同的告警方式。单击告警通知配置底部的添加告警接收配置添加新配置。同一个规则内最多可以支持添加10组告警接收配置。

查看告警规则列表

告警规则新建完成后会展示在告警规则列表,列表内显示规则名称、告警类型、告警方式、接收人等信息,并且提供规则开关、规则详情等功能帮助用户管理维护告警规则。




功能描述

信息
描述
规则名称
显示告警规则名称与 ID 号。
监控对象
显示告警规则生效的任务、工作流、项目这三种监控对象,并可以查看监控对象下告警规则涉及的计算任务。
告警类型
显示告警规则的监控类型:失败、超时、成功。
告警级别
显示告警规则的告警级别:普通、重要、紧急。
告警启停
显示告警规则当前的启动状态,可以人为进行开关。处于停止状态时,告警规则将不会生效,告警信息也不会生成。
告警方式
显示告警规则的告警信息发送渠道。
接收人
显示告警规则配置的告警信息接收人以及告警升级人。
创建人
显示当前告警规则的创建人。

操作告警规则





功能描述

信息
描述
规则详情
通过规则详情可以查看告警规则配置时的各项参数,包括规则名称、监控对象、监控任务、告警条件、告警通知。
告警信息
跳转到对应告警规则触发后生成的告警信息列表页面,可以查看告警规则每一次触发生成的告警信息详情。
删除
删除此条告警规则。

筛选告警规则

在搜索框中输入告警规则名称或 ID 可以对列表进行筛选。




告警信息

告警规则针对监控对象触发后生成的告警信息会展示在告警信息列表中,列表中提供了告警信息的详情与运行日志,以及基本信息查看功能。

查看告警信息列表

2. 单击左侧菜单中的项目列表,找到需要操作数据管理功能的目标项目。
3. 选择项目后,单击进入数据开发模块。
4. 单击左侧菜单中的告警信息,进入告警信息管理页面。


功能描述

信息
描述
告警时间
显示告警信息的生成时间。
告警任务
显示触发告警信息的任务实例名称与实例 ID。单击实例名称可以跳转到对应实例的管理页面。



告警原因
显示当前告警信息的被触发原因。
告警级别
显示告警信息的告警级别:普通、重要、紧急。
规则名称
显示触发该条告警信息的告警规则,单击规则名称可以跳转到对应告警规则的管理页面。

告警方式
显示告警信息的发送渠道。
接收人
显示告警信息的接收人。

操作告警信息



查看详情

单击操作列下的查看详情,在弹框中可以看到告警信息的告警对象、告警原因以及信息发送状态。


功能描述

信息
描述
告警对象
显示触发告警信息的任务实例名称与实例 ID。
任务名称:显示触发告警信息的计算任务的任务名称,单击任务名称会跳转到触发该告警信息的实例所在页面。
实例 ID:显示触发告警信息的实例 ID,单击查看日志会跳转到对应实例的日志信息页面。
告警原因
根据配置的告警规则触发条件显示当前告警信息的被触发原因。
例如告警条件选择:运行超时>预计完成时间,则规则触发后显示的告警原因为:预计完成时间超时。
发送状态
显示当前告警信息的发送时间、接收人与发送渠道,从发送渠道的状态中可以看到各渠道下是否发送成功。
发送时间:显示规则触发后向接收人发送告警信息的时间。
接收人:显示告警信息接收人。
发送渠道:使用不同图标显示各个渠道的告警信息发送状态。

确认告警

若告警设置中配置了告警升级人,操作栏中会有确认告警选项。单击确认告警后,告警信息将不再发送给告警升级人。


筛选告警信息

操作
描述
告警时间
筛选条件可以选择今天、昨天、近7天、近30天、全部,或自定义日期范围
告警原因
可以筛选告警条件为失败、成功、超时或实例数波动的告警信息。
任务名称/ID
根据任务名称/ID筛选,多个任务名称/ID使用 | 分割
规则名称/ID
根据规则名称/ID筛选,多个规则名称/ID使用|分割

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈