准备工作(购买配额及准备训练素材)
购买额度后,您可以通过数智人平台,直接录制素材来进行多语种的声音复刻。 访问路径:首页 > 形象设定 > 定制资产管理 > 新增定制任务 > 声音复刻(极速版-小语种),如下图所示。
主要填写信息包括:定义音色名称、确定音色的性别、选择训练的语种。
主要上传的素材有:授权音频(按照指定内容录制后上传,注意请严格遵守这里的要求,页面会有相关提示)、需要进行训练的音频素材。
音频要求如下:
1. 支持上传1个音频文件定制,建议音频时长为10-90S,不超过20M;
2. 音频格式支持 wav、mp3、aac、m4a、wma、asf,采样率支持16K、24K、48K;对于压缩格式,建议码率大于128kbps;
3. 音频命名为2-50个字符,只允许有汉字、字母、数字、下划线、横线。
提交素材,进入训练
所有材料都传递后,点击“确认提交”会弹出如下弹窗,选择“同意并提交”,正常情况下音色会进入训练状态。
查看训练进程
提交后,会弹出一个提示:提交成功(如上图所示)。可以在该页面里直接点击“查看进度”跳转到进度查询页,也可以直接点击进行下图所示位置,可以查看音色的训练进度,当显示完成后,就可以在“场景应用”中使用该音色了。
注意:
如果声音定制失败的话,请不用担心,相关配额会自动返还,可以继续重新尝试训练。