tencent cloud

数据开发治理平台 WeData

产品动态
动态发布记录(2026年)
产品简介
产品概述
产品优势
产品架构
产品功能
应用场景
购买指南
计费概述
产品版本购买说明
执行资源购买说明
购买方式
欠费说明
退费说明
准备工作
账号和权限管理概述
添加白名单/安全组(可选)
通过 Microsoft Entra ID(Azure AD)单点登录(SSO)WeData
操作指南
管理控制台
项目管理
数据集成
Studio
数据开发
数据分析
数据科学
数据治理(with Unity Semantics)
API 文档
History
Introduction
API Category
Making API Requests
Smart Ops Related Interfaces
Project Management APIs
Resource Group APIs
Data Development APIs
Data Asset - Data Dictionary APIs
Data Development APIs
Ops Center APIs
Data Operations Related Interfaces
Data Exploration APIs
Asset APIs
Metadata Related Interfaces
Task Operations APIs
Data Security APIs
Instance Operation and Maintenance Related Interfaces
Data Map and Data Dictionary APIs
Data Quality Related Interfaces
DataInLong APIs
Platform Management APIs
Data Source Management APIs
Data Quality APIs
Platform Management APIs
Asset Data APIs
Data Source Management APIs
Data Types
Error Codes
WeData API 2025-08-06
服务等级协议
相关协议
隐私协议
数据处理和安全协议
联系我们
词汇表

Mongo/腾讯云 Mongo 数据源

PDF
聚焦模式
字号
最后更新时间: 2024-11-01 17:12:17
腾讯云 Mongo 数据源与 Mongo 数据源配置方式相同,此处以 Mongo 数据源为例进行讲解。

支持版本

支持 MongoDB 3.6、4.x、5.x、6.x 版本。

使用限制

1. 增量同步时,where 条件语法: create_time>= '${yyyy-MM-dd-1d HH:mm:ss}' and create_time < '${yyyy-MM-dd HH:mm:ss}'
Bound 目前支持整型和日期函数配置。日期函数配置使用方法:
// 转化为13位时间戳(毫秒)
TimestampMillis('yyyy-MM-ddTHH:mm:00+0800')
TimestampMillis('2023-07-10T00:00:00+0800')
TimestampMillis('2023-07-10 00:00:00')
TimestampMillis('2023-07-10')

// 转化为10位时间戳(秒)
TimestampSeconds('yyyy-MM-ddTHH:mm:00+0800')
TimestampSeconds('2023-07-10T00:00:00+0800')
TimestampSeconds('2023-07-10 00:00:00')
TimestampSeconds('2023-07-10')
2. 支持使用 MongoDB 数据库对应账号进行连接,如果您使用的是云数据库 MongoDB 版,默认会有一个 admin 账号。出于安全策略的考虑,在添加使用MongoDB 数据源时,请避免使用 admin 作为访问账号。
3. 如果 MongoDB 为分片集群,则在配置数据源时,需要配置 mongos 地址,避免配置 mongod/shard 节点地址。否则同步任务在抽取 MongoDB 中数据时,可能会导致只查询到指定 shard 的数据,而非预期的全集。关于 mongos、mongod,详情请参见 mongos shards
4. 在并发大于1的情况下,同步任务配置的集合中所有 _id 字段类型必须一致(例如,_id 字段都为 string 类型或者 ObjectId 类型),否则会出现部分数据无法同步的问题。
说明:
并发大于1时,任务拆分会使用 _id 字段进行划分,因而在此场景下 _id 字段不支持混合类型。如果 _id 有多种字段类型,您可以使用单并发的形式进行数据同步,且不配置 splitFactor 或 splitFactor 配置为1。

Mongo 离线单表读取节点配置




参数
说明
数据来源
可用的 Mongo 数据源。
支持选择、或者手动输入需读取的库名称
默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。
当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。
集合
支持选择、或者手动输入需读取的集合。
分割符
当字段为数组类型时,使用分割符拼接数组内容。
筛选条件(选填)
根据数据类型填写对应筛选语句,该语句会作为将要同步数据的筛选条件。
高级设置(选填)
可根据业务需求配置参数。

Mongo 离线单表写入节点配置




参数
说明
数据去向
选择当前项目中可用的 Mongodb 数据源。
支持选择、或者手动输入需读取的库名称
默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。
当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。
集合
支持选择、或者手动输入需读取的集合。
写入模式
表示写入数据时,是否针对相同的主键覆盖写入。默认使用 _id 每行记录的业务主键
前置语句
选填,表示数据同步写入 MongoDB 前的前置操作,请确保前置语句符合 JSON 语句要求,如{"type": "remove"}
高级设置(选填)
可根据业务需求配置参数。

数据类型转换支持

读取

Mongo 读取支持的数据类型及转换对应关系如下(在处理 Mongo 时,会先将 Mongo 数据源的数据类型和数据处理引擎的数据类型做映射):
Mongo 数据类型
内部类型
int32,int64,bigint
Long
double,decimal
Double
string, array,map,list
String
date,datetime
Date
boolean
Boolean
bytes
Bytes

写入

Mongo 写入支持的数据类型及转换对应关系如下:
内部类型
Mongo 数据类型
Long
int, Long
Double
double,decimal
String
string, array
Date
date,datetime
Boolean
boolean
Bytes
bytes


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈