tencent cloud

文档反馈

语音识别

最后更新时间:2024-03-13 11:32:21

    简介

    本文档提供关于数据万象语音识别模板SDK使用方式。
    API
    操作名
    操作描述
    创建模板
    用于创建一个新的模板
    删除语音识别模板
    删除模板
    删除一个模板
    查询模板
    查询模板列表
    修改模板
    修改一个模板

    基本操作

    创建模板

    功能说明

    用于创建一个新的模板。

    方法原型

    def ci_create_asr_template(self, Bucket, Name, EngineModelType, ChannelNum,
    ResTextFormat, FilterDirty=0, FilterModal=0, ConvertNumMode=0, SpeakerDiarization=0,
    SpeakerNumber=0, FilterPunc=0, OutputFileType='txt', **kwargs)

    参数说明

    Request 的具体参数描述如下:
    节点名称(关键字)
    描述
    类型
    必选
    Bucket
    存储桶名称
    String
    Name
    模板名称仅支持中文、英文、数字、_、-和*
    String
    EngineModelType
    引擎模型类型,分为电话场景和非电话场景。
    电话场景:
    8k_zh:电话 8k 中文普通话通用(可用于双声道音频);
    8k_zh_s:电话 8k 中文普通话话者分离(仅适用于单声道音频);
    8k_en:电话 8k 英语; 非电话场景:
    16k_zh:16k 中文普通话通用;
    16k_zh_video:16k 音视频领域;
    16k_en:16k 英语;
    16k_ca:16k 粤语;
    16k_ja:16k 日语;
    16k_zh_edu:中文教育;
    16k_en_edu:英文教育;
    16k_zh_medical:医疗;
    16k_th:泰语;
    16k_zh_dialect:多方言,支持23种方言。
    String
    ChannelNum
    语音声道数:
    1 表示单声道.EngineModelType为非电话场景仅支持单声道;
    2 表示双声道(仅支持 8k_zh 引擎模型 双声道应分别对应通话双方)。
    int
    ResTextFormat
    识别结果返回形式:
    0 表示识别结果文本(含分段时间戳);
    1 词级别粒度的详细识别结果,不含标点,含语速值.(词时间戳列表,一般用于生成字幕场景)
    2 词级别粒度的详细识别结果(包含标点、语速值)。
    int
    FilterDirty
    是否过滤脏词(目前支持中文普通话引擎):
    0 表示不过滤脏词;
    1 表示过滤脏词;
    2 表示将脏词替换为 *。
    默认值为 0。
    int
    FilterModal
    是否过语气词(目前支持中文普通话引擎):
    0 表示不过滤语气词;
    1 表示部分过滤;
    2 表示严格过滤 。
    默认值为 0。
    int
    ConvertNumMode
    是否进行阿拉伯数字智能转换(目前支持中文普通话引擎):
    0 表示不转换,直接输出中文数字;
    1 表示根据场景智能转换为阿拉伯数字。
    3 表示打开数学相关数字转换。
    默认值为 0。
    int
    SpeakerDiarization
    是否开启说话人分离:
    0 表示不开启;
    1 表示开启(仅支持8k_zh,16k_zh,16k_zh_video,单声道音频)。
    默认值为 0。
    注意:8k电话场景建议使用双声道来区分通话双方,设置ChannelNum=2即可,不用开启说话人分离。
    int
    SpeakerNumber
    说话人分离人数(需配合开启说话人分离使用),取值范围:0-10。
    0代表自动分离(目前仅支持≤6个人),1-10代表指定说话人数分离。默认值为 0。
    int
    FilterPunc
    是否过滤标点符号(目前支持中文普通话引擎):
    0 表示不过滤。
    1 表示过滤句末标点。
    2 表示过滤所有标点。
    默认值为 0。
    int
    OutputFileType
    输出文件类型,可选txt、srt。默认为txt
    String

    请求示例

    def ci_create_asr_template():
    # 创建语音识别模板
    response = client.ci_create_asr_template(
    Bucket=bucket_name,
    Name='templateName',
    EngineModelType='16k_zh',
    ChannelNum=1,
    ResTextFormat=2,
    )
    print(response)
    return response

    返回结果说明

    {
    'RequestId': 'NjMyMjliMWZfZWM0YTYyNjRfNWNmNF8xMDBh',
    'Template': {
    'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32',
    'Name': 'templateName',
    'State': 'Normal',
    'Tag': 'SpeechRecognition',
    'CreateTime': '2022-09-15T11:25:19+0800',
    'UpdateTime': '2022-09-15T11:25:19+0800',
    'BucketId': 'testpic-1253960454',
    'Category': 'Custom',
    'SpeechRecognition': {
    'EngineModelType': '16k_zh',
    'ChannelNum': '1',
    'ResTextFormat': '2',
    'FilterDirty': '0',
    'FilterModal': '0',
    'ConvertNumMode': '0',
    'SpeakerDiarization': '0',
    'SpeakerNumber': '0',
    'FilterPunc': '0',
    'OutputFileType': 'txt'
    }
    }
    }
    响应字段详情详见 创建语音识别模板响应信息

    删除模板

    功能说明

    删除一个模板

    方法原型

    def ci_delete_asr_template(self, Bucket, TemplateId, **kwargs)

    参数说明

    参数名称
    描述
    类型
    必选
    Bucket
    Bucket 的命名规则为 BucketName-APPID,详情请参见 存储桶概述
    String
    TemplateId
    要取消的模板 id
    String

    请求示例

    def ci_delete_asr_template():
    # 删除指定语音识别模板
    response = client.ci_delete_asr_template(
    Bucket=bucket_name,
    TemplateId='t1bdxxxxxxxxxxxxxxxxx94a9',
    )
    print(response)
    return response

    返回结果说明

    {
    'RequestId': 'NjMyMjlkZmRfZWM0YTYyNjRfNWNmNF8xMDBi',
    'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32'
    }
    响应字段详情详见DeleteTemplate响应信息

    查询模板列表

    功能说明

    查询模板列表

    方法原型

    def ci_get_asr_template(self, Bucket, Category='Custom', Ids='', Name='', PageNumber=1, PageSize=10, **kwargs)

    参数说明

    参数名称
    描述
    类型
    必选
    Bucket
    Bucket 的命名规则为 BucketName-APPID,详情请参见 存储桶概述
    String
    Category
    Official,Custom,默认值:Custom
    String
    Ids
    模板 ID,以,符号分割字符串
    String
    Name
    模板名称前缀
    String
    PageNumber
    第几页
    Integer
    PageSize
    每页个数
    Integer

    请求示例

    def ci_get_asr_template():
    # 获取语音识别模板
    response = client.ci_get_asr_template(
    Bucket=bucket_name,
    )
    print(response)
    return response

    返回结果说明

    {
    'TotalCount': '1',
    'RequestId': 'NjMyMjljNTlfMTIwNjUzMDlfMmUzYV8xMWNh',
    'PageNumber': '1',
    'PageSize': '10',
    'TemplateList': [
    {
    'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32',
    'Name': 'templateName',
    'State': 'Normal',
    'Tag': 'SpeechRecognition',
    'CreateTime': '2022-09-15T11:25:19+0800',
    'UpdateTime': '2022-09-15T11:25:19+0800',
    'BucketId': 'testpic-1253960454',
    'Category': 'Custom',
    'SpeechRecognition': {
    'EngineModelType': '16k_zh',
    'ChannelNum': '1',
    'ResTextFormat': '2',
    'FilterDirty': '0',
    'FilterModal': '0',
    'ConvertNumMode': '0',
    'SpeakerDiarization': '0',
    'SpeakerNumber': '0',
    'FilterPunc': '0',
    'OutputFileType': 'txt'
    }
    }
    ]
    }

    修改模板

    功能说明

    修改模板

    方法原型

    def ci_update_asr_template(self, Bucket, TemplateId, Name, EngineModelType, ChannelNum,
    ResTextFormat, FilterDirty=0, FilterModal=0, ConvertNumMode=0, SpeakerDiarization=0,
    SpeakerNumber=0, FilterPunc=0, OutputFileType='txt', **kwargs)

    参数说明

    节点名称(关键字)
    描述
    类型
    必选
    bucketName
    Bucket 的命名规则为 BucketName-APPID,详情请参见 存储桶概述
    String
    templateId
    修改的模板 ID
    String
    说明:
    其余参数请参见 创建模板接口,与其参数一致。

    请求示例

    def ci_update_asr_template():
    # 修改语音识别模板
    response = client.ci_update_asr_template(
    Bucket=bucket_name,
    TemplateId='t1bdxxxxxxxxxxxxxxxxx94a9',
    Name='QueueId1',
    EngineModelType='16k_zh',
    ChannelNum=1,
    ResTextFormat=1,
    )
    print(response)
    return response

    返回结果说明

    {
    'RequestId': 'NjMyMjlkNzhfMTIwNjUzMDlfMmUxZF8xMGM4',
    'Template': {
    'TemplateId': 't1c1287c04c147443da0b2cc7b8fbabf32',
    'Name': 'QueueId1',
    'State': 'Normal',
    'Tag': 'SpeechRecognition',
    'CreateTime': '2022-09-15T11:25:19+0800',
    'UpdateTime': '2022-09-15T11:35:20+0800',
    'BucketId': 'testpic-1253960454',
    'Category': 'Custom',
    'SpeechRecognition': {
    'EngineModelType': '16k_zh',
    'ChannelNum': '1',
    'ResTextFormat': '1',
    'FilterDirty': '0',
    'FilterModal': '0',
    'ConvertNumMode': '0',
    'SpeakerDiarization': '0',
    'SpeakerNumber': '0',
    'FilterPunc': '0',
    'OutputFileType': 'txt'
    }
    }
    }
    响应字段详情详见 更新语音识别模板响应信息
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持