tencent cloud

腾讯云智能数智人

产品简介
产品概述
产品功能
产品优势
购买指南
价格指南
购买指引
使用代金券购买流程
退费说明
数智人形象介绍
形象类别介绍
基础形象库
形象和声音复刻指引
数智人平台操作指引
访问平台
形象生产与资产管理
数智人会话互动应用与管理
播报数智人视频生成与管理
运营管理与分析
服务端 API 接入
数智人 API 接入模式概述
数智人 aPaas 接口调用方式
2D真人小样本形象、声音定制 API 文档
视频生成服务 API 文档
交互数智人服务 API 文档
个人资产管理 API 文档
客户端 SDK 接入
整体介绍
3D 端渲染 SDK 接入
2D 端渲染 SDK 接入
数智人 SSML 标记语言规范
相关协议
隐私协议
DSA(Data Sharing Agreement)
常见问题

提交音质检测任务

PDF
聚焦模式
字号
最后更新时间: 2024-07-18 18:08:43
朗读获取声音训练文本内容,录制好音频文件上传到指定 cos 路径后,需要进行音频质量检测,检测通过的音频会返回 AudioId,使用该 AudioId 调用定制接口进行一句话声音定制。

调用协议

HTTPS + JSON
POST /v2/ivh/assetmanager/zeroshotservice/detectaudioquality
Header Content-Type: application/json;charset=utf-8

请求参数

参数
类型
必须
说明
TextId
string
获取声音训练文本接口返回的 TextId
ReferenceText
string
音频参考文本,ReferenceText 和 TextId 为两种不同方式获取声音训练文本,可以都不填或二选一,能获取更加准确音质检测结果
AudioUrl
string
语音文件 url 地址,要求: 1、url 地址为通过4.1上传到指定路径的资源 url 地址后增加 zeroshot 路径,例如/customer-pipline/{数字}/{uuid}/zeroshot/xxx.mp3 2、建议上传音频时长为10-30S,单个文件不超过20M 3、音频格式支持 wav、mp3、aac、m4a、wma、asf,采样率需大于16K;对于压缩格式,建议码率大于128kbps 4、音频命名为2-50个字符,只允许有汉字、字母、数字、下划线、横线

返回参数

参数
类型
必须
说明
TaskId
string
制作的任务 ID,携带 TaskId 访问查询音质检测任务进度,可获得检测进度和检测结果

请求示例

{ "Header": {}, "Payload": { "AudioId": "XXXX", "AudioUrl": "YYYY" } }

返回示例

{ "Header": { "Code": 0, "DialogID": "", "Message": "", "RequestID": "123" }, "Payload": { "TaskId": "666" } }

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈