tencent cloud

数据湖计算

产品动态
产品简介
产品概述
产品优势
应用场景
购买指南
计费概述
退费说明
欠费说明
调整配置费用说明
快速入门
新用户开通全流程
DLC 数据导入指引
一分钟入门 DLC 数据分析
一分钟入门 DLC 权限管理
一分钟入门分区表
开启数据优化
跨源分析 EMR Hive 数据
标准引擎配置指引
配置数据访问策略
操作指南
控制台操作介绍
开发指南
运行环境
SparkJar 作业开发指南
PySpark 作业开发指南
查询性能优化指南
UDF 函数开发指南
系统约束
客户端访问
JDBC 访问
TDLC 命令行工具访问
第三方软件联动
Python 访问
实践教程
通过 Power BI 访问 DLC 数据操作指南
建表实践
使用 Apache Airflow 调度 DLC 引擎提交任务
StarRocks 直接查询 DLC 内部存储
Spark 计算成本优化实践
DATA + AI
使用 DLC 分析 CLS 日志
使用角色 SSO 访问 DLC
资源级鉴权指南
在 DLC 中实现 TCHouse-D 读写操作
DLC 原生表
SQL 语法
SuperSQL 语法
标准 Spark 语法概览
标准 Presto 语法概览
保留字
API 文档
History
Introduction
API Category
Making API Requests
Data Table APIs
Task APIs
Metadata APIs
Service Configuration APIs
Permission Management APIs
Database APIs
Data Source Connection APIs
Data Optimization APIs
Data Engine APIs
Resource Group for the Standard Engine APIs
Data Types
Error Codes
通用类参考
错误码
配额与限制
第三方软件连接DLC操作指南
常见问题
权限类常见问题
引擎类常见问题
功能类常见问题
Spark 作业类常见问题
DLC 政策
隐私协议
数据处理和安全协议
服务等级协议
联系我们

创建数据作业

PDF
聚焦模式
字号
最后更新时间: 2025-12-24 11:48:21

前期准备

在开始创建数据作业前,您需先完成数据访问策略配置,以保证数据作业能安全的访问您的数据。配置步骤请参见 配置数据访问策略

创建步骤

1. 登录 数据湖计算 DLC 控制台,单击左侧菜单数据作业进入数据作业管理页。
2. 单击创建作业按钮,进入创建页。




选择数据访问策略

进入 数据湖 DLC 控制台 > 数据作业页面,单击创建作业按钮,进入创建页,数据访问策略选项自动填入常驻访问策略,可通过下拉选项选择其他访问策略,若需要新增或切换常驻访问策略详见配置数据访问策略
配置参数如下:
配置参数
说明
作业名称
支持中文、英文、数字和“_”,最多100个字符
作业类型
批处理:基于 Spark jar 的批处理数据作业
流处理:基于 Spark Streaming 的流式数据作业
SQL作业:后台封装为 Jar 包,调用 spark.sql 算子执行 SQL 语句
程序包
支持 jar 格式。
支持选择对象存储 cos 内文件或本地上传,本地上传不可超过5MB,如程序包超过5MB可先将程序包上传到 cos 后使用。
支持直接填写 cos 存储路径
主类(Main Class)
选择 jar 文件时必填。jar 包的主类参数,多个参数使用空格分割
程序入口参数
非必填。程序的入口参数,支持填写多个。多个参数使用“空格”分割
作业参数
非必填。作业-config 信息,spark.开头的参数,按照k=v格式填写,多个参数换行填写。
示例:spark.network.timeout=120s
Spark镜像
必填。
依赖 jar 资源(--jar)
非必填。支持 jar 格式,可选择多个
支持选择对象存储 cos 内文件或本地上传,本地上传不可超过5MB,如资源超过5MB可先将资源上传到 cos 后使用。
支持直接填写 cos 存储路径,多个路径以“;”隔开
依赖 py 资源(--py-files)
非必填。支持 py、zip、egg 格式,可选择多个
支持选择对象存储 cos 内文件或本地上传,本地上传不可超过5MB,如资源超过5MB可先将资源上传到 cos 后使用。
支持直接填写 cos 存储路径,多个路径以“;”隔开
依赖 files 资源(--files)
非必填。暂不支持 jar、zip 格式,可选择多个
支持选择对象存储 cos 内文件或本地上传,本地上传不可超过5MB,如资源超过5MB可先将资源上传到 cos 后使用。
支持直接填写 cos 存储路径,多个路径以“;”隔开
依赖 archives 资源(--archives)
非必填。支持 tar.gz、tgz、tar 格式,可选择多个
支持选择对象存储 cos 内文件或本地上传,本地上传不可超过5MB,如资源超过5MB可先将资源上传到 cos 后使用。
支持直接填写 cos 存储路径,多个路径以“;”隔开
CAM Role arn
在作业配置中配置的数据访问策略,指定了数据作业可访问的数据范围。详细配置说明参见 配置数据访问策略
资源配置
可配置数据作业的引擎资源,可配置资源数不超过所选的数据引擎规格。资源说明:1CU≈1核4G
计费 CU 数 = Executor 资源 * Executor 数量 + Driver 资源
按量计费的数据引擎费用将按计算 CU 数的使用量收取
完成配置填写后,保存即可完成创建。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈