产品简介

最后更新时间：2025-01-23 17:24:00

产品简介

最后更新时间： 2025-01-23 17:24:00

腾讯云语音识别（Automatic Speech Recognition，ASR） 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用，外部落地录音质检、会议实时转写、语音输入法等多个场景。
产品功能
实时语音识别
对实时音频流进行识别，达到“边说边出文字”的效果，可应用于语音输入、电话机器人等实时音频流场景。
录音文件识别
对录音文件进行识别，能够针对较长的录音音频进行异步处理，可应用于客服质检、字幕生成等长音频场景。
产品优势
海量数据积累
立足于腾讯庞大的社交数据平台，积累了数十万小时的语音标注数据，拥有丰富多样的语料库，为高识别率奠定数据基础。  
算法业界领先
基于多种序列神经网络结构（LSTM、Attention Model、DeepCNN），采用 Multitask 训练方法，结合T/S方式，在通用以及垂直领域有业内领先的识别精度。
支持多平台设备
提供 REST API 和 SDK，支持智能硬件、移动应用、网站、桌面客户端和物联网等多种设备终端。
支持语种丰富
已经支持中文、英文，后续将持续开放其他语种和语言的识别能力。
噪声环境识别佳
语音识别模型鲁棒性佳，识别精度高，抗噪声的干扰能力强，能够识别来自嘈杂环境的音频信息，不需要客户进行降噪处理。
海量内外部业务验证
经过微信、腾讯视频、王者荣耀等内部业务充分验证，也在大量互联网、金融、教育等领域的外部客户业务场景成功落地，日服务亿级用户，性能稳定。
应用场景
语音输入法
智能语音输入，由实时语音识别实现，为用户节省输入时间、提升输入体验。
会议纪要
将会议、庭审、采访等场景的音频信息转换为文字，由实时语音识别服务实现，降低人工记录成本、提升效率。
呼叫中心
将坐席通话转成文字，由实时语音识别服务实现，全面覆盖质检内容、提升质检效率。

本页内容是否解决了您的问题？

您也可以联系销售或提交工单以寻求帮助。

是

否

文档反馈

tencent cloud

产品功能

实时语音识别

录音文件识别

产品优势

海量数据积累

算法业界领先

支持多平台设备

支持语种丰富

噪声环境识别佳

海量内外部业务验证

应用场景

语音输入法

会议纪要

呼叫中心