tencent cloud

腾讯云智能数智人

产品简介
产品概述
产品功能
产品优势
购买指南
价格指南
购买指引
使用代金券购买流程
退费说明
数智人形象介绍
形象类别介绍
基础形象库
形象和声音复刻指引
数智人平台操作指引
访问平台
形象生产与资产管理
数智人会话互动应用与管理
播报数智人视频生成与管理
运营管理与分析
服务端 API 接入
数智人 API 接入模式概述
数智人 aPaas 接口调用方式
2D真人小样本形象、声音定制 API 文档
视频生成服务 API 文档
交互数智人服务 API 文档
个人资产管理 API 文档
客户端 SDK 接入
整体介绍
3D 端渲染 SDK 接入
2D 端渲染 SDK 接入
数智人 SSML 标记语言规范
相关协议
隐私协议
DSA(Data Sharing Agreement)
常见问题

声音复刻录制指引-极速版(小语种)

PDF
聚焦模式
字号
最后更新时间: 2025-04-14 14:43:06
在对接前,可以看下我们支持的语种清单:附录4-语种列表

准备工作(购买配额及准备训练素材)

购买额度后,您可以通过数智人平台,直接录制素材来进行多语种的声音复刻。
访问路径:首页 > 形象设定 > 定制资产管理 > 新增定制任务 > 声音复刻(极速版-小语种),如下图所示。

您也可以通过接口提交素材定制:可参考接口调用逻辑示意图
主要填写信息包括:定义音色名称、确定音色的性别、选择训练的语种。
主要上传的素材有:授权音频(按照指定内容录制后上传,注意请严格遵守这里的要求,页面会有相关提示)、需要进行训练的音频素材。

音频要求如下:
1. 支持上传1个音频文件定制,建议音频时长为10-90S,不超过20M;
2. 音频格式支持 wav、mp3、aac、m4a、wma、asf,采样率支持16K、24K、48K;对于压缩格式,建议码率大于128kbps;
3. 音频命名为2-50个字符,只允许有汉字、字母、数字、下划线、横线。


提交素材,进入训练

所有材料都传递后,点击“确认提交”会弹出如下弹窗,选择“同意并提交”,正常情况下音色会进入训练状态。



查看训练进程

提交后,会弹出一个提示:提交成功(如上图所示)。可以在该页面里直接点击“查看进度”跳转到进度查询页,也可以直接点击进行下图所示位置,可以查看音色的训练进度,当显示完成后,就可以在“场景应用”中使用该音色了。

注意:
如果声音定制失败的话,请不用担心,相关配额会自动返还,可以继续重新尝试训练。










帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈