tencent cloud

腾讯云智能数智人

产品简介
产品概述
产品功能
产品优势
购买指南
价格指南
购买指引
使用代金券购买流程
退费说明
数智人形象介绍
形象类别介绍
基础形象库
形象和声音复刻指引
数智人平台操作指引
访问平台
形象生产与资产管理
数智人会话互动应用与管理
播报数智人视频生成与管理
运营管理与分析
服务端 API 接入
数智人 API 接入模式概述
数智人 aPaas 接口调用方式
2D真人小样本形象、声音定制 API 文档
视频生成服务 API 文档
交互数智人服务 API 文档
个人资产管理 API 文档
客户端 SDK 接入
整体介绍
3D 端渲染 SDK 接入
2D 端渲染 SDK 接入
数智人 SSML 标记语言规范
相关协议
隐私协议
DSA(Data Sharing Agreement)
常见问题

定制接口

PDF
聚焦模式
字号
最后更新时间: 2025-07-03 11:34:16
使用该接口提交定制的请求,通过 进度查询接口 查询定制的各个阶段以及各阶段的相关信息。

调用协议

HTTPS + JSON
POST /v2/ivh/assetmanager/customservice/make
Header Content-Type: application/json;charset=utf-8

请求参数

参数
类型
必须
说明
AnchorName
string
主播名称:
1. 该名称主要用于标识该定制形象/声音,可以根据实际情况自定义。
2. 命名参考:如果该主播定制的数量只有1个,可以直接以主播名称命名,例如“张三”;也可加上衣服名称来更好的标识,例如“张三蓝西服”等。
3. 不超过50个字符,不少于2个字符,只允许有汉字、字母、数字、下划线、横线。
4. 不能重名。
MakeType
string
定制类别:
1. IMAGE:2D 小样本-标准版(专属口型)形象定制。
2. IMAGE_GENERAL:2D 小样本-标准版(通用口型)形象定制。
3. IMAGE_4K:2D 小样本-高精版(专属口型)形象定制。
4. IMAGE_PHOTO:2D 小样本(照片数智人)形象定制。
5. VOICE:声音复刻(基础版)。
6. ZERO_SHOT_VOICE:声音复刻(极速版)。
IdentityCosUrl
string
除 IMAGE_PHOTO、ZERO_SHOT_VOICE 定制类型无需填写外,其他定制类型与IdentityWrittenCosUrl 二选一或二者都填。
视频格式授权书 URL,要求:
1. URL 地址为通过 上传素材到腾讯云 COS 上传到指定路径的资源 URL 地址后增加 idcard 路径,例如,域名 /customer-pipline/{数字}/{uuid}/idcard/a.mp4。
2. 该格式主要适用于“口述版授权书”,也可将“书面版授权书”拍成完整清晰的视频形式提交。
IdentityWrittenCosUrl
string
除 IMAGE_PHOTO、ZERO_SHOT_VOICE 定制类型无需填写外,其他定制类型与 IdentityCosUrl 二选一或二者都填。
pdf 格式授权书 URL,要求:
1. URL 地址为通过 上传素材到腾讯云 COS 上传到指定路径的资源URL地址后增加 idcard 路径,例如,域名 /customer-pipline/{数字}/{uuid}/idcard/b.pdf。
2. 该格式主要适用于“书面版授权书”,以完整清晰的扫描件形式提交。
MaterialCosUrl
string
除 ZERO_SHOT_VOICE 定制类型无需填写外,其他定制类型必填。

形象定制素材 URL 地址要求:
1. URL 地址为通过 上传素材到腾讯云 COS 上传到指定路径的资源 URL 地址后增加 video 路径,例如,/customer-pipline/{数字}/{uuid}/video/c.mp4。
2. 视频大小,不超过5GB,4K不超过10G。
3. 视频时长:专属口型版本定制时长为2 - 10分钟;通用口型版本定制时长为1 - 10分钟;高精版本定制时长为2 - 10分钟
4. 视频分辨率:1080P、4K(3840*2160),如定制高精版,则必须为4K
5. 视频长宽比:16:9 (9:16)
6. 视频帧率:不低于25fps,不超过60fps
7. 视频格式:mp4,mov

声音定制素材 URL 地址要求:
1. URL 地址为通过 上传素材到腾讯云 COS 上传到指定路径的资源 URL 地址后增加 audio 路径,例如,/customer-pipline/{数字}/{uuid}/audio/c.zip。
2. 压缩包格式:.zip 格式的压缩包,单个 zip 包用于定制1个音色;压缩时不要新建文件夹,直接选中所有 wav 压缩。
3. 对于单个 zip 包里的音频注意事项:
音频数量:每个 zip 包里可以包含1条或多条 wav 格式音频,总量不超过10条。
音频大小:每个 zip 包里的音频大小总和不超过1G。
音频格式:每条音频需为 wav 格式,其他格式的音频请先转码为 wav 格式后再压缩成 zip 包。
音频采样率:采样率大于等于24K即可,建议24K、36K。
音频命名:名称不要有空格或者特殊字符,后缀名需要为小写“.wav”。

照片数智人定制素材 URL 地址要求:
1. URL 地址为通过 上传素材到腾讯云 COS 上传到指定路径的资源 URL 地址后增加 photo 路径,例如,/customer-pipline/{数字}/{uuid}/photo/example.png。
2. 图片名称:不少于2个字符,只允许有汉字、字母、数字、下划、横线;图片格式:支持 jpg、jpeg、png、webp;图片大小:不超过16M;图片宽高比:支持 1:1 9:16 16:9 4:3。
3. 人物清晰正面照,脸部居中,表情自然,嘴部闭合。
IsHaveBackground
bool
形象定制类型,训练出来的形象是否带原始背景。默认“否”,即不带原始背景,在应用过程中可以按需更换背景
SexType
string
性别:
MALE:男
FEMALE:女
Notes
string
定制备注信息,100字以内
TextDriver
string
用于生成驱动 demo 的文本内容,字符长度在4 - 1000之间(包括 SSML 标签,单个中文算一个字符)
VoiceDriverCosFile
string
生成驱动 demo 的音频文件路径,要求:
1. URL 地址为通过 上传素材到腾讯云 COS 上传到指定路径的资源 URL 地址后增加 audio 路径,例如,/customer-pipline/{数字}/{uuid}/audio/example.wav
2. 音频文件大小不超过10M,格式支持 wav、mp3、wma、m4a、aac
AudioId
string
ZERO_SHOT_VOICE 定制类型必填,填写 查询音质检测任务进度 通过后返回的 AudioId


返回参数

参数
类型
必须
说明
TaskId
string
制作的任务 ID,携带 TaskId 访问 进度查询接口,可获得制作进度和制作结果

请求示例

{
"Header": {},
"Payload": {
"AnchorName": "静萱绿裙子坐姿",
"MakeType": "IMAGE",
"IdentityCosUrl": "XXXX",
"MaterialCosUrl": "YYYY",
"IsRemoveBackground": true
}
}

返回示例

{
"Header": {
"Code": 0,
"DialogID": "",
"Message": "",
"RequestID": "123"
},
"Payload": {
"TaskId": "666"
}
}
 


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈