tencent cloud

数据开发治理平台 WeData

产品动态
动态发布记录(2026年)
产品简介
产品概述
产品优势
产品架构
产品功能
应用场景
购买指南
计费概述
产品版本购买说明
执行资源购买说明
购买方式
欠费说明
退费说明
准备工作
账号和权限管理概述
添加白名单/安全组(可选)
通过 Microsoft Entra ID(Azure AD)单点登录(SSO)WeData
操作指南
管理控制台
项目管理
数据集成
Studio
数据开发
数据分析
数据科学
数据治理(with Unity Semantics)
API 文档
History
Introduction
API Category
Making API Requests
Smart Ops Related Interfaces
Project Management APIs
Resource Group APIs
Data Development APIs
Data Asset - Data Dictionary APIs
Data Development APIs
Ops Center APIs
Data Operations Related Interfaces
Data Exploration APIs
Asset APIs
Metadata Related Interfaces
Task Operations APIs
Data Security APIs
Instance Operation and Maintenance Related Interfaces
Data Map and Data Dictionary APIs
Data Quality Related Interfaces
DataInLong APIs
Platform Management APIs
Data Source Management APIs
Data Quality APIs
Platform Management APIs
Asset Data APIs
Data Source Management APIs
Data Types
Error Codes
WeData API 2025-08-06
服务等级协议
相关协议
隐私协议
数据处理和安全协议
联系我们
词汇表

数据质量概述

PDF
聚焦模式
字号
最后更新时间: 2026-02-26 11:14:01
数据质量是数据治理的核心环节之一,旨在帮助用户在第一时间发现在数据集成与数据开发中产生的脏数据,自动拦截异常任务,阻断脏数据向下游蔓延传递,降低用户问题处理成本和资源损耗。
适用角色:数据开发工程师、数仓库表负责人。

费用说明

数据质量任务运行将产生的费用主要有以下三部分:
1. WeData 产品功能版本费用(前提)。
2. WeData 执行资源费用:根据质量任务实例所消耗的调度资源进行按量收费。
3. 非 WeData 直接费用:质量任务校验需要引擎、数据源服务配合执行(例如 EMR、DLC、TCHouse-D、TCHouse-P 等),将产生引擎费用,此费用由引擎侧收取,不包含在 WeData 账单计费项中。各引擎具体收费标准请至腾讯云官网参考各引擎产品文档中的计费说明。
详情请参考 购买指南

核心能力

质量模块主要包含以下核心功能:
1. 支持多种腾讯云大数据存储引擎(EMR、DLC、TCHouse-P、TCHouse-D)以及开源大数据存储引擎(Doris)。
2. 可按照表级、字段级配置数据质量检测规则。
3. 基于实际业务场景配置执行策略。
4. 设置规则强弱决定是否阻塞下游任务。
5. 支持多种触达用户方式(企微群、微信、电话、短信、邮件、飞书群、钉钉群)。
6. 可从六个维度(准确性、及时性、完整性、唯一性、一致性和有效性)统计质量评分,并形成库表维度的质量报告。

模块功能

数据质量各模块功能介绍如下:
功能
简述
质量概览
质量结果概览:
查看检测情况、规则运行情况;
查看告警情况、表告警排行。
规则模板
统一管理规则模板,便于统一复用:
56+系统内置模板:仅支持查看;
自定义规则模板:支持增删改查操作。
数据监控
创建检测规则:
支持多种腾讯云大数据引擎:EMR、DLC、TCHouse-P、TCHouse-D、Doris;
支持多种新建方式:单表新增、多表新增、批量上传。
查看检测规则:
支持多种查看方式:查看全部、表维度、规则维度;
支持查看某张表的规则列表,并进行规则管理。
运维管理
执行实例与结果:
支持查看质量任务的运行结果,并可查看每条规则历史运行情况;
支持导出执行结果,并查看历史导出日志。
质量任务:
支持查看已经生成的质量检测任务;
支持为质量任务配置告警信息。
告警信息:
支持查看历史告警情况。
质量报告
质量报告:
支持将历史运行结果以多个维度统计为质量分:库表、规则维度;
支持多个维度查看质量分:综合质量度、维度质量分、质量分明细。

核心流程




关键名词解释:
名词
解释说明
独立周期
对选定的数据库表、核心业务字段按天、按小时、按分钟等自定义频率设置周期性质量检测。质量任务会按设定的周期定时执行,如发现异常,会第一时间通知订阅人。
关联调度
将质量任务与生产任务(数据同步任务或者数据开发任务)进行关联,当生产任务运行结束后,插入运行质量规则任务。如发现异常,会第一时间通知处理人进行处理,并根据任务级别阻塞下游任务执行避免问题数据扩展。

注意事项

EMR、DLC、TCHouse-P、TCHouse-D 配置表、字段数据质量规则后,产出数据的调度节点需要使用网络已经连通的调度资源组执行,并保障执行机稳定且版本已更新至新版本,才可以正常触发数据质量规则校验。
每个表均可配置多个表级、字段级数据质量规则,同时执行校验。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈