tencent cloud

数据万象

动态与公告
产品动态
产品公告
产品简介
产品概述
产品优势
应用场景
功能概览
地域与域名
使用限制
产品计费
计费概述
计费方式
计费项
免费额度
欠费说明
查看消费明细
常见问题
快速入门
注册与登录
绑定存储桶
上传和处理文件
下载和删除文件
解绑存储桶
通过 COS 使用数据万象
能力地图
图片处理
媒体处理
内容审核
AI 内容识别
文档处理
智能语音
文件处理
用户指南
概览
存储桶管理
智能工具箱
任务与工作流
数据监控
用量统计
实践教程
版权保护解决方案
图片处理实践
API 授权策略使用指引
工作流实践
API 文档
API 概览
结构体
公共请求头部
公共响应头部
开通万象服务
图片处理
AI 内容识别
智能语音
媒体处理
内容审核
文档处理
文件处理
任务与工作流
云查毒
错误码
请求签名
SDK 文档
SDK 概览
图片处理 Android SDK
图片处理 iOS SDK
COS Android SDK
C SDK
C++ SDK
.NET(C#) SDK
Go SDK
COS iOS SDK
Java SDK
JavaScript SDK
Node.js SDK
PHP SDK
Python SDK
小程序 SDK
SDK 产品个人信息保护规则
安全与合规
权限管理
常见问题
基础设置
文档处理
媒体处理
内容识别
智能语音
服务协议
Service Level Agreement
联系我们
词汇表

语音识别

PDF
聚焦模式
字号
最后更新时间: 2024-03-13 11:32:21

简介

本文档提供关于数据万象语音识别模板SDK使用方式。
API
操作名
操作描述
创建模板
用于创建一个新的模板
删除语音识别模板
删除模板
删除一个模板
查询模板
查询模板列表
修改模板
修改一个模板

基本操作

创建模板

功能说明

用于创建一个新的模板。

方法原型

def ci_create_asr_template(self, Bucket, Name, EngineModelType, ChannelNum,
ResTextFormat, FilterDirty=0, FilterModal=0, ConvertNumMode=0, SpeakerDiarization=0,
SpeakerNumber=0, FilterPunc=0, OutputFileType='txt', **kwargs)

参数说明

Request 的具体参数描述如下:
节点名称(关键字)
描述
类型
必选
Bucket
存储桶名称
String
Name
模板名称仅支持中文、英文、数字、_、-和*
String
EngineModelType
引擎模型类型,分为电话场景和非电话场景。
电话场景:
8k_zh:电话 8k 中文普通话通用(可用于双声道音频);
8k_zh_s:电话 8k 中文普通话话者分离(仅适用于单声道音频);
8k_en:电话 8k 英语; 非电话场景:
16k_zh:16k 中文普通话通用;
16k_zh_video:16k 音视频领域;
16k_en:16k 英语;
16k_ca:16k 粤语;
16k_ja:16k 日语;
16k_zh_edu:中文教育;
16k_en_edu:英文教育;
16k_zh_medical:医疗;
16k_th:泰语;
16k_zh_dialect:多方言,支持23种方言。
String
ChannelNum
语音声道数:
1 表示单声道.EngineModelType为非电话场景仅支持单声道;
2 表示双声道(仅支持 8k_zh 引擎模型 双声道应分别对应通话双方)。
int
ResTextFormat
识别结果返回形式:
0 表示识别结果文本(含分段时间戳);
1 词级别粒度的详细识别结果,不含标点,含语速值.(词时间戳列表,一般用于生成字幕场景)
2 词级别粒度的详细识别结果(包含标点、语速值)。
int
FilterDirty
是否过滤脏词(目前支持中文普通话引擎):
0 表示不过滤脏词;
1 表示过滤脏词;
2 表示将脏词替换为 *。
默认值为 0。
int
FilterModal
是否过语气词(目前支持中文普通话引擎):
0 表示不过滤语气词;
1 表示部分过滤;
2 表示严格过滤 。
默认值为 0。
int
ConvertNumMode
是否进行阿拉伯数字智能转换(目前支持中文普通话引擎):
0 表示不转换,直接输出中文数字;
1 表示根据场景智能转换为阿拉伯数字。
3 表示打开数学相关数字转换。
默认值为 0。
int
SpeakerDiarization
是否开启说话人分离:
0 表示不开启;
1 表示开启(仅支持8k_zh,16k_zh,16k_zh_video,单声道音频)。
默认值为 0。
注意:8k电话场景建议使用双声道来区分通话双方,设置ChannelNum=2即可,不用开启说话人分离。
int
SpeakerNumber
说话人分离人数(需配合开启说话人分离使用),取值范围:0-10。
0代表自动分离(目前仅支持≤6个人),1-10代表指定说话人数分离。默认值为 0。
int
FilterPunc
是否过滤标点符号(目前支持中文普通话引擎):
0 表示不过滤。
1 表示过滤句末标点。
2 表示过滤所有标点。
默认值为 0。
int
OutputFileType
输出文件类型,可选txt、srt。默认为txt
String

请求示例

def ci_create_asr_template():
# 创建语音识别模板
response = client.ci_create_asr_template(
Bucket=bucket_name,
Name='templateName',
EngineModelType='16k_zh',
ChannelNum=1,
ResTextFormat=2,
)
print(response)
return response

返回结果说明

{
'RequestId': 'NjMyMjliMWZfZWM0YTYyNjRfNWNmNF8xMDBh',
'Template': {
'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32',
'Name': 'templateName',
'State': 'Normal',
'Tag': 'SpeechRecognition',
'CreateTime': '2022-09-15T11:25:19+0800',
'UpdateTime': '2022-09-15T11:25:19+0800',
'BucketId': 'testpic-1253960454',
'Category': 'Custom',
'SpeechRecognition': {
'EngineModelType': '16k_zh',
'ChannelNum': '1',
'ResTextFormat': '2',
'FilterDirty': '0',
'FilterModal': '0',
'ConvertNumMode': '0',
'SpeakerDiarization': '0',
'SpeakerNumber': '0',
'FilterPunc': '0',
'OutputFileType': 'txt'
}
}
}
响应字段详情详见 创建语音识别模板响应信息

删除模板

功能说明

删除一个模板

方法原型

def ci_delete_asr_template(self, Bucket, TemplateId, **kwargs)

参数说明

参数名称
描述
类型
必选
Bucket
Bucket 的命名规则为 BucketName-APPID,详情请参见 存储桶概述
String
TemplateId
要取消的模板 id
String

请求示例

def ci_delete_asr_template():
# 删除指定语音识别模板
response = client.ci_delete_asr_template(
Bucket=bucket_name,
TemplateId='t1bdxxxxxxxxxxxxxxxxx94a9',
)
print(response)
return response

返回结果说明

{
'RequestId': 'NjMyMjlkZmRfZWM0YTYyNjRfNWNmNF8xMDBi',
'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32'
}
响应字段详情详见DeleteTemplate响应信息

查询模板列表

功能说明

查询模板列表

方法原型

def ci_get_asr_template(self, Bucket, Category='Custom', Ids='', Name='', PageNumber=1, PageSize=10, **kwargs)

参数说明

参数名称
描述
类型
必选
Bucket
Bucket 的命名规则为 BucketName-APPID,详情请参见 存储桶概述
String
Category
Official,Custom,默认值:Custom
String
Ids
模板 ID,以,符号分割字符串
String
Name
模板名称前缀
String
PageNumber
第几页
Integer
PageSize
每页个数
Integer

请求示例

def ci_get_asr_template():
# 获取语音识别模板
response = client.ci_get_asr_template(
Bucket=bucket_name,
)
print(response)
return response

返回结果说明

{
'TotalCount': '1',
'RequestId': 'NjMyMjljNTlfMTIwNjUzMDlfMmUzYV8xMWNh',
'PageNumber': '1',
'PageSize': '10',
'TemplateList': [
{
'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32',
'Name': 'templateName',
'State': 'Normal',
'Tag': 'SpeechRecognition',
'CreateTime': '2022-09-15T11:25:19+0800',
'UpdateTime': '2022-09-15T11:25:19+0800',
'BucketId': 'testpic-1253960454',
'Category': 'Custom',
'SpeechRecognition': {
'EngineModelType': '16k_zh',
'ChannelNum': '1',
'ResTextFormat': '2',
'FilterDirty': '0',
'FilterModal': '0',
'ConvertNumMode': '0',
'SpeakerDiarization': '0',
'SpeakerNumber': '0',
'FilterPunc': '0',
'OutputFileType': 'txt'
}
}
]
}

修改模板

功能说明

修改模板

方法原型

def ci_update_asr_template(self, Bucket, TemplateId, Name, EngineModelType, ChannelNum,
ResTextFormat, FilterDirty=0, FilterModal=0, ConvertNumMode=0, SpeakerDiarization=0,
SpeakerNumber=0, FilterPunc=0, OutputFileType='txt', **kwargs)

参数说明

节点名称(关键字)
描述
类型
必选
bucketName
Bucket 的命名规则为 BucketName-APPID,详情请参见 存储桶概述
String
templateId
修改的模板 ID
String
说明:
其余参数请参见 创建模板接口,与其参数一致。

请求示例

def ci_update_asr_template():
# 修改语音识别模板
response = client.ci_update_asr_template(
Bucket=bucket_name,
TemplateId='t1bdxxxxxxxxxxxxxxxxx94a9',
Name='QueueId1',
EngineModelType='16k_zh',
ChannelNum=1,
ResTextFormat=1,
)
print(response)
return response

返回结果说明

{
'RequestId': 'NjMyMjlkNzhfMTIwNjUzMDlfMmUxZF8xMGM4',
'Template': {
'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32',
'Name': 'QueueId1',
'State': 'Normal',
'Tag': 'SpeechRecognition',
'CreateTime': '2022-09-15T11:25:19+0800',
'UpdateTime': '2022-09-15T11:35:20+0800',
'BucketId': 'testpic-1253960454',
'Category': 'Custom',
'SpeechRecognition': {
'EngineModelType': '16k_zh',
'ChannelNum': '1',
'ResTextFormat': '1',
'FilterDirty': '0',
'FilterModal': '0',
'ConvertNumMode': '0',
'SpeakerDiarization': '0',
'SpeakerNumber': '0',
'FilterPunc': '0',
'OutputFileType': 'txt'
}
}
}
响应字段详情详见 更新语音识别模板响应信息


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈