tencent cloud

腾讯云智能数智人

声音复刻录制指引-极速版(小语种)

Download
聚焦模式
字号
最后更新时间: 2025-04-14 14:43:06
在对接前,可以看下我们支持的语种清单:附录4-语种列表

准备工作(购买配额及准备训练素材)

购买额度后,您可以通过数智人平台,直接录制素材来进行多语种的声音复刻。
访问路径:首页 > 形象设定 > 定制资产管理 > 新增定制任务 > 声音复刻(极速版-小语种),如下图所示。

您也可以通过接口提交素材定制:可参考接口调用逻辑示意图
主要填写信息包括:定义音色名称、确定音色的性别、选择训练的语种。
主要上传的素材有:授权音频(按照指定内容录制后上传,注意请严格遵守这里的要求,页面会有相关提示)、需要进行训练的音频素材。

音频要求如下:
1. 支持上传1个音频文件定制,建议音频时长为10-90S,不超过20M;
2. 音频格式支持 wav、mp3、aac、m4a、wma、asf,采样率支持16K、24K、48K;对于压缩格式,建议码率大于128kbps;
3. 音频命名为2-50个字符,只允许有汉字、字母、数字、下划线、横线。


提交素材,进入训练

所有材料都传递后,点击“确认提交”会弹出如下弹窗,选择“同意并提交”,正常情况下音色会进入训练状态。



查看训练进程

提交后,会弹出一个提示:提交成功(如上图所示)。可以在该页面里直接点击“查看进度”跳转到进度查询页,也可以直接点击进行下图所示位置,可以查看音色的训练进度,当显示完成后,就可以在“场景应用”中使用该音色了。

注意:
如果声音定制失败的话,请不用担心,相关配额会自动返还,可以继续重新尝试训练。










帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈