产品简介
购买指南
数智人形象介绍
- 形象类别介绍
- 基础形象库
- 形象和声音复刻指引
数智人平台操作指引
- 访问平台
- 形象生产与资产管理
- 数智人会话互动应用与管理
- 播报数智人视频生成与管理
- 运营管理与分析
播报服务
- 视频生成服务 API 文档
交互服务
- API（云渲染、端渲染）
- SDK（端渲染）
- 交互数智人实践教程（云渲染）
定制服务
- 2D真人小样本形象、声音定制 API 文档
- 2D 端渲染形象定制及下载、使用流程
其他配套
- 数智人 aPaas 接口调用方式
- 个人资产管理 API 文档
数智人 SSML 标记语言规范
相关协议
- 隐私协议
- DSA（Data Sharing Agreement）
常见问题

声音复刻录制指引-极速版（小语种）

Download

聚焦模式

字号

最后更新时间： 2025-04-14 14:43:06

在对接前，可以看下我们支持的语种清单：附录4-语种列表﻿
准备工作（购买配额及准备训练素材）
购买额度后，您可以通过数智人平台，直接录制素材来进行多语种的声音复刻。
访问路径：首页 > 形象设定 > 定制资产管理 > 新增定制任务 > 声音复刻（极速版-小语种），如下图所示。
﻿
您也可以通过接口提交素材定制：可参考接口调用逻辑示意图。
主要填写信息包括：定义音色名称、确定音色的性别、选择训练的语种。
主要上传的素材有：授权音频（按照指定内容录制后上传，注意请严格遵守这里的要求，页面会有相关提示）、需要进行训练的音频素材。
﻿
音频要求如下：
1. 支持上传1个音频文件定制，建议音频时长为10-90S，不超过20M；
2. 音频格式支持 wav、mp3、aac、m4a、wma、asf，采样率支持16K、24K、48K；对于压缩格式，建议码率大于128kbps；
3. 音频命名为2-50个字符，只允许有汉字、字母、数字、下划线、横线。
﻿
提交素材，进入训练
所有材料都传递后，点击“确认提交”会弹出如下弹窗，选择“同意并提交”，正常情况下音色会进入训练状态。
﻿
﻿
查看训练进程
提交后，会弹出一个提示：提交成功（如上图所示）。可以在该页面里直接点击“查看进度”跳转到进度查询页，也可以直接点击进行下图所示位置，可以查看音色的训练进度，当显示完成后，就可以在“场景应用”中使用该音色了。
﻿
注意：
如果声音定制失败的话，请不用担心，相关配额会自动返还，可以继续重新尝试训练。
﻿
﻿
﻿
﻿
﻿
﻿
﻿
﻿
﻿