tencent cloud

数据开发治理平台 WeData

产品动态
动态发布记录(2026年)
产品简介
产品概述
产品优势
产品架构
产品功能
应用场景
购买指南
计费概述
产品版本购买说明
执行资源购买说明
购买方式
欠费说明
退费说明
准备工作
账号和权限管理概述
添加白名单/安全组(可选)
通过 Microsoft Entra ID(Azure AD)单点登录(SSO)WeData
操作指南
管理控制台
项目管理
数据集成
Studio
数据开发
数据分析
数据科学
数据治理(with Unity Semantics)
API 文档
History
Introduction
API Category
Making API Requests
Smart Ops Related Interfaces
Project Management APIs
Resource Group APIs
Data Development APIs
Data Asset - Data Dictionary APIs
Data Development APIs
Ops Center APIs
Data Operations Related Interfaces
Data Exploration APIs
Asset APIs
Metadata Related Interfaces
Task Operations APIs
Data Security APIs
Instance Operation and Maintenance Related Interfaces
Data Map and Data Dictionary APIs
Data Quality Related Interfaces
DataInLong APIs
Platform Management APIs
Data Source Management APIs
Data Quality APIs
Platform Management APIs
Asset Data APIs
Data Source Management APIs
Data Types
Error Codes
WeData API 2025-08-06
服务等级协议
相关协议
隐私协议
数据处理和安全协议
联系我们
词汇表

数据补录

PDF
聚焦模式
字号
最后更新时间: 2026-03-18 11:27:05

打开数据补录配置页面

1. 登录腾讯云 WeData 数据开发治理平台
2. 单击左侧目录树项目列表。
3. 选择对应的项目,并在右侧操作栏中单击进入运维中心模块。
4. 在左侧目录树中单击任务运维,并在工作流列表或任务列表中选择补数据。
说明:
一次性任务不可补数据。

说明:
任务列表支持多选任务批量补数据。在页面上方选择任务列表后,在任务名前勾选并单击补数据即可批量补数据。

创建补录任务步骤

第一步:选择任务


功能说明
参数
说明
补录计划名称
默认使用 patch_年月日时分秒_唯一数字生成,项目内唯一。例如:patch_20230624195944_548。支持用户自定义名称。
描述
用户可以自定义补录计划描述,最长256个字符,选填。
补录类型
任务补录:在任务列表执行补数据后默认选中,对选中任务作为候选。
工作流补录:在工作流列表执行补数据后默认选中,对选中工作流内任务作为候选。
文件夹补录:对编排空间中的文件夹内所有工作流内的任务作为候选。
项目补录:将当前项目下的所有任务作为候选。
补录任务范围
选中任务:仅可在工作流或选中任务中选择。
选中任务及下游任务:可在工作流或选中任务及其下游任务中选择。
仅包含下游任务:仅可在工作流或选中任务的下游任务中选择。
注意:
仅状态为“调度中”、“已暂停”、“已失效”的任务支持补录。单次补录根节点数量不能超过500个,如果超出限制,请用户缩小选择范围。
选择根任务
在工作流下任务或选中任务中选择需要补录的根节点。
选择下游任务
若补录任务范围选择“选中任务及下游任务”或“仅包含下游任务”时,才展示选择下游任务的配置。
补录任务黑名单
选择补录类型为项目补录后可以配置,除黑名单任务外,项目下其余符合补录条件的任务参与本次补录。
选择好任务后单击下一步。

第二步:参数配置


功能说明
参数
说明
计划调度时间
用户可以自定义计划调度时间,可以选择任意时间(支持选择未来时间),默认选中昨天(最多支持多选10个时间段)。
小时范围
默认00:00 - 23:59,只针对小时及周期小于小时的任务生效。结合数据日期最终生成补录实例。例如,选择了01:00 - 02:00,那么小时任务中定时在01:00任务实例会补录,03:00的任务实例不会补录。
上游依赖配置
检查全部上游任务:选中的补录任务按照任务配置的依赖关系运行。
全部不检查:选中的补录任务不按照任务依赖关系运行,并行运行。
只在选中任务中检查:选中的补录任务只从选中的任务中检查依赖关系,不从非选中任务中检查依赖关系。
事件依赖配置
用户配置是否要在运行前检查依赖的上游事件已发生。
自依赖配置
默认任务原有自依赖配置(原有任务的自依赖配置),用户可以自定义,可选择并行度(最小为2,默认值为2,最大值为10),设置并行后将不会使用任务原有的自依赖关系。任务自依赖仅在当次补录实例中生效。
工作流自依赖配置
工作流自依赖仅在当次补录实例中生效。若选择是则表示当前周期的所有实例依赖本工作流上个周期的所有实例。
生效条件如下:
1.工作流的所有任务均为同周期任务;
2.仅针对本次补录计划生效。
执行资源组
默认任务原有的资源组,用户可以重新指定补录实例运行的调度资源组和集成资源组,不影响周期任务执行资源的配置。
执行顺序
优先按依赖关系执行,无依赖关系影响的情况下按配置执行顺序执行。可选的执行顺序可以按照实例数据时间顺序或实例数据时间倒序。
补录实例生成周期
可重新指定补录任务实例的生成周期,目前只会将天实例转换成每月1号生成的实例。
自定义参数
可以重新指定任务的参数,方便补录实例执行新的逻辑。
调度参数
默认任务自带参数,用户可以重新指定任务的参数,方便补录实例执行新的逻辑,新的参数会覆盖之前任务参数值。
参数名支持下拉选择配置参数,选择参数名后参数值会自动填充,可按需修改。
应用参数
针对Spark SQL、PySpark任务,支持重新指定应用参数值。
离线同步速率限制
若补录任务包含离线同步任务,则可指定同步速率。按照流量或记录条数限制同步速率以保护数据来源端或者数据去向端的读写压力。默认-1表示不限制速率。
配置好时间和参数后,单击下一步。

第三步:信息预览


预览补录包含配置预览、高级配置预览和实例预览。实例预览可查看预计补录任务数和实例数,及具体的补录实例。
1. 预览无误后单击确认补录,若项目开启补录审批,则在审批后才会生成补录计划并执行。
2. 补录计划创建完成后,用户可以单击左侧数据补录记录,进入补录列表查看补录详情和进度。

数据补录记录



补录记录筛选

数据补录记录支持根据补录计划名称、任务名称/ID、创建时间、创建人、实例状态筛选。
注意:
时区功能暂不上线。

补录信息查看

数据补录以三级列表形式提供补录任务的查看和操作。


一级列表

列表展示:默认展示补录任务名称、计划调度时间、任务个数、创建时间、创建人、运行状态、开始时间、结束时间、操作。
运行状态
运行中:当前补录任务中有实例处于运行中、未运行的状态。
完成:当前补录任务中所有实例都处于完成、终止或失败的状态。
完成率:状态为(成功、终止、失败)的实例总数/实例总数。
成功率:状态为(成功)的实例总数/实例总数。
开始/结束时间:补录任务中第一个实例开始的时间和最后一个实例结束的时间。
操作
配置详情:单击查看当前补录任务的配置详情。
批量终止:对“等待运行”或“运行中”的实例进行强制终止,其他状态实例默认忽略!批量操作是异步操作,实例状态会有延时。

二级列表

展示当前任务名称、任务 ID、负责人、类型、实例个数、状态、操作。
操作-查看实例:若补录只选择了一个时间段,则支持点击跳转到实例列表页,并选中本次补录该任务的实例。

三级列表

展示当前计划调度时间、运行开始时间、运行结束时间、执行时长,执行状态及操作。
诊断:当任务失败后可以通过诊断判断失败的原因,并支持跳转对应任务详情查看。
操作:支持查看日志和终止实例操作。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈