tencent cloud

功能相关
最后更新时间:2025-01-23 17:32:51
功能相关
最后更新时间: 2025-01-23 17:32:51

不同使用场景对应的是语音识别哪种服务?

实时语音识别适用于有实时性要求的场景,例如语音输入法、语音机器人、会议现场记录等场景。

支持远场和离线的语音识别吗?

不支持。目前仅实时语音识别支持移动端离线语音识别,如有需要请 提交工单 咨询。

语音识别支持中英文混合场景和地方方言吗?

普通话引擎支持单词级别的中英文混合识别,且支持带口音的中文普通话语音识别。
实时语音识别支持中文普通话和英文。
说明:
若有马来语 越南语 印地语 土耳其和阿拉伯语等更多语种需求,可提交工单

语音识别支持的输入音频时长是多少?

实时语音音频流中每个数据包的音频分片为200ms。

语音识别支持什么样的音频属性?

语音识别服务的对于音频属性的详细规定请参见 语音识别服务详细信息页

实时语音识别中,如果一段音频包含多句话该如何提高准确率?

建议开启 VAD 功能,VAD(Voice Activity Detection)是指对音频进行分段的技术,如果一段音频中包含了多句话,VAD 可以检测多句话之间的停顿进行自动断句,从而达到更高的识别准确度。

语音识别是否支持同步的结果调用形式?

实时语音识别支持同步返回识别结果。

语音识别是否支持评测?

不支持。

语音识别识别出来的文字能否复制?

语音识别识别出来的文字无法复制,复制功能需要接入之后自己前端开发实现。

实时语音识别能否设置识别的最长时间?

不能设置识别最长时间。如果不需要,直接断开即可。

语音识别是否支持 MRCP 协议?

MRCP 暂未对外开放,如有需要,可提交工单

有没有 SaaS 化的可以直接提供给客户用?

语音识别支持私有化部署,需要商务对接跟进,可提交工单
本页内容是否解决了您的问题?
您也可以 联系销售 提交工单 以寻求帮助。

文档反馈