tencent cloud

语音识别

新手指引
产品简介
产品简介
访问管理
购买指南
计费概述
购买方式
欠费说明
快速入门
操作指引
一分钟接入服务端 API
新手常见问题
API 文档
History
Introduction
API Category
Making API Requests
Recording Recognition APIs
实时语音识别相关接口
Data Types
Error Codes
SDK 文档
一分钟跑通集成 SDK
常见问题
识别效果问题排查
服务与计费相关
功能相关
API 与 SDK 相关
其他相关
相关协议
Service Level Agreement
隐私协议
数据处理和安全协议
联系我们
词汇表

词汇表

PDF
聚焦模式
字号
最后更新时间: 2025-01-23 17:33:18

API

ASR

语音识别技术(ASR),也被称为自动语音识别(Automatic Speech Recognition),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与“说话人识别”及“说话人确认”不同,后者尝试识别/确认的对象是发出语音的人而非语音中所包含的词汇、句子等内容。

采样位数

采样位数即将采样样本振幅量化。并支持待识别音频的采样位数为16Bit。

QPS/并发

QPS/并发指每秒请求的并发数,1QPS 即每秒同时支持请求接口1次,50QPS 即每秒同时支持请求接口50次。

SDK

SDK(Software Development Kit)是软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。

通道数

通道数指声音的通道数目,常有单声道和立体声(双声道)。我们的一句话语音识别服务和实时语音识别服务暂时只支持单声道音频识别,录音文件识别既支持单声道音频,也支持立体声音频识别。

应用程序编程接口

应用程序编程接口(Application Programming Interface,API)指软件系统提供给应用程序调用的代码。 开发人员可以通过调用一组功能接口,而无需考虑底层源代码或理解内部工作机制。 API 包含 Windows API 和 Linux API,腾讯云 OCR 提供的 API 一般指 Linux API。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈