tencent cloud

数据万象

动态与公告
产品动态
产品公告
产品简介
产品概述
产品优势
应用场景
功能概览
地域与域名
使用限制
产品计费
计费概述
计费方式
计费项
免费额度
欠费说明
查看消费明细
常见问题
快速入门
注册与登录
绑定存储桶
上传和处理文件
下载和删除文件
解绑存储桶
通过 COS 使用数据万象
能力地图
图片处理
媒体处理
内容审核
AI 内容识别
文档处理
智能语音
文件处理
用户指南
概览
存储桶管理
智能工具箱
任务与工作流
数据监控
用量统计
实践教程
版权保护解决方案
图片处理实践
API 授权策略使用指引
工作流实践
API 文档
API 概览
结构体
公共请求头部
公共响应头部
开通万象服务
图片处理
AI 内容识别
智能语音
媒体处理
内容审核
文档处理
文件处理
任务与工作流
云查毒
错误码
请求签名
SDK 文档
SDK 概览
图片处理 Android SDK
图片处理 iOS SDK
COS Android SDK
C SDK
C++ SDK
.NET(C#) SDK
Go SDK
COS iOS SDK
Java SDK
JavaScript SDK
Node.js SDK
PHP SDK
Python SDK
小程序 SDK
SDK 产品个人信息保护规则
安全与合规
权限管理
常见问题
基础设置
文档处理
媒体处理
内容识别
智能语音
服务协议
Service Level Agreement
联系我们
词汇表

语音识别

PDF
聚焦模式
字号
最后更新时间: 2026-01-22 10:29:21

产品简介

数据万象语音识别功能可针对录音文件进行识别,异步返回识别文本,目前支持语言类型包括中文普通话、英语和粤语。同时,数据万象支持对识别结果进行处理,包括脏词屏蔽、语气词过滤、阿拉伯数字智能转换等,满足多种语音识别需求。
说明:
使用语音识别功能需要先开通数据万象服务,产生的费用将由数据万象服务收取,详细的计费说明请参见数据万象 智能语音费用
使用语音识别服务时,请先确认相关限制条件与地域,详情请见 使用限制


功能体验

您可在线体验语音识别功能,单击前往 数据万象体验馆


适用场景

呼叫中心语音质检

数据万象语音识别服务支持对电话场景下的录音文件进行识别,通过对通话双方语音内容进行分离,可实现客服服务评级打分,提升电话客服服务质量。

视频字幕生成

针对音频文件,可生成单个词语及对应时间戳列表,可便捷地为对应视频增加字幕。

会议语音资料转写

大型会议记录工作内容繁杂,若会议时长较长、参会人员较多,则更加难以完整记录。数据万象语音识别服务可对中文普通话、英语和粤语进行识别,减少与会人员会议记录工作量,提升会议效果。


前提条件

已开通 COS 服务、创建存储桶并上传文件到存储桶。具体操作请参见 存储桶文件
已开通数据万象服务并绑定存储桶。具体操作请参见 存储桶绑定


使用方法

任务

针对存储在对象存储(Cloud Object Storage,COS)上的存量数据,您可创建语音识别任务。
控制台方式:您可使用数据万象控制台,可视化创建任务,使用详情请见 提交语音识别任务
API 方式:您可使用语音识别 API 创建任务,详情请查看 语音识别 API 文档



帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈