tencent cloud

腾讯云智能数智人

产品简介
产品概述
产品功能
产品优势
购买指南
价格指南
购买指引
使用代金券购买流程
退费说明
数智人形象介绍
形象类别介绍
基础形象库
形象和声音复刻指引
数智人平台操作指引
访问平台
形象生产与资产管理
数智人会话互动应用与管理
播报数智人视频生成与管理
运营管理与分析
服务端 API 接入
数智人 API 接入模式概述
数智人 aPaas 接口调用方式
2D真人小样本形象、声音定制 API 文档
视频生成服务 API 文档
交互数智人服务 API 文档
个人资产管理 API 文档
客户端 SDK 接入
整体介绍
3D 端渲染 SDK 接入
2D 端渲染 SDK 接入
数智人 SSML 标记语言规范
相关协议
隐私协议
DSA(Data Sharing Agreement)
常见问题

视频制作接口-基础版

PDF
聚焦模式
字号
最后更新时间: 2024-07-18 18:23:48

接口说明

使用 ssml 文本和数智人进行视频制作,通过音视频制作进度查询接口最终返回成品视频和字幕文件。
注意:
不支持定义主播位置等未剪辑高级参数,如需使用需要切换到 视频制作接口-进阶版 接口。

调用协议

HTTPS + JSON
POST     /v2/ivh/videomaker/broadcastservice/videomake
Header   Content-Type: application/json;charset=utf-8

请求参数

参数
类型
必须
说明
VirtualmanKey
string
定义播报的角色、服装、姿态、分辨率等信息,参数为枚举值。
InputSsml
string
播报的文本内容,支持ssml标签,支持的标签类型参照 数智人 SSML 标记语言规范,标签写法参照示例,内容不能换行,符号需转义。上限2万字(字数按 unicode 字符数计算)。DriverType为空、或 Text 时,该字段必填
SpeechParam
object
定义音频的详细参数
SpeechParam.Speed
float
语速(1.0为正常语速,范围[0.5-1.5],值为0.5时播报语速最慢,值为1.5时播报语速最快,DriverType为音频驱动类型时,语速控制不生效)
SpeechParam.TimbreKey
string
音色key,默认使用形象自有音色
SpeechParam.Volume
int
音量大小,范围[0,10],对应音量大小。默认为0,代表正常音量,值越大音量越高。
SpeechParam.EmotionCategory
string
控制合成音频的情感,仅支持多情感音色使用,可选值参考个人资产管理 API 分页查询音色列表接口。
SpeechParam.EmotionIntensity
int
控制合成音频情感程度,取值范围为 [50,200],只有 EmotionCategory 不为空时生效。
VideoParam
object
定义合成视频的详细参数,
VideoParam.Format
string
视频输出格式,默认 TransparentWebm
TransparentWebm:透明背景 webm 格式视频
GreenScreenMp4:绿幕 mp4 格式视频
CallbackUrl
string
当用户增加回调 url 时,将把视频制作结果以固定格式发送 post 请求到该 url 地址,固定格式见 附录二: 回调请求体格式,需注意:
1、限制CallbackUrl长度小于1000
2、只发送一次请求,无论是哪种问题导致的请求失败,都不会再进行发送。
DriverType
string
驱动类型,默认Text
1. Text:文本驱动,要求InputSsml字段必填
2. OriginalVoice:原声音频驱动,要求InputAudioUrl字段必填
3. ModulatedVoice:变声音频驱动,可通过Speech.TimbreKey指定音色,未填写时使用主播默认音色
InputAudioUrl
string
驱动数智人的音频url,当DriverType为OriginalVoice、ModulatedVoice时,该字段必填。
音频格式要求:
1. 小样本形象时长不超过60分钟,不少于0.5秒;非小样本形象时长不超过10分钟,不少于0.5秒
2. 支持格式:wav、mp3、wma、m4a、aac
VideoStorageS3Url
string
可传入含鉴权 s3 协议存储 url,视频成品会上传至该 url
SubtitleStorageS3Url
string
可传入含鉴权 s3 协议存储 url,字幕成品会上传至该 url
ConcurrencyType
string
视频制作任务使用的并发类型,默认采用优先使用独享,其次使用共享的策略
1. Exclusive:独享并发,若无独享并发,任务提交失败
2. Shared: 共享并发

返回参数

参数
类型
必须
说明
TaskId
string
视频制作的任务 ID,携带 TaskId 访问音视频制作进度查询接口,可获得制作进度和制作结果

请求示例

{
"Header": {},
"Payload": {
"VirtualmanKey": "123",
"InputSsml": "你好,我是虚拟<phoneme alphabet=\\"py\\" ph=\\"fu4\\">主</phoneme>播",
"SpeechParam": {
"Speed": 1.0
},
"VideoParam": {
"Format": "GreenScreenMp4"
}
}
}

返回示例

{
"Header": {
"Code": 0,
"DialogID": "",
"Message": "",
"RequestID": "123",
},
"Payload": {
"TaskId": "123"
}
}
 
 

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈