tencent cloud

媒体处理

动态与公告
产品动态
产品公告
产品简介
产品概述
产品功能
产品优势
应用场景
购买指南
计费说明
购买指引
续费说明
欠费说明
退费说明
快速入门
控制台指南
概览
创建任务
任务管理
编排管理
模板管理
资源包管理
视频评测
AIGC 内容生成
终端 SDK
字幕编辑工具
用量统计
访问管理示例
接入教程
音视频转码接入
音视频增强接入
音频分离接入
数字水印及明水印接入
媒体 AI 接入教程
媒体质检接入
终端 SDK 接入
直播流录制接入
DRM 接入
其他接入教程
场景实践教程
画质提升场景
音视频成本优化场景
短剧出海场景
生成式场景
在线教育场景
API 文档
History
Introduction
API Category
调用方式
发起处理任务相关接口
任务管理相关接口
转码增强模板相关接口
水印模板相关接口
截图模板相关接口
媒体AI模板相关接口
媒体AI-热词库相关接口
媒体AI-样本管理相关接口
媒体质检模板相关接口
直播录制模板相关接口
编排管理相关接口
数据统计相关接口
媒体传输-安全组管理相关接口
解析事件通知相关接口
图片处理模板相关接口
AI创作相关接口
其他接口
Data Types
Error Codes
其他说明文档
WebSocket 识别协议
常见问题
产品基础相关
账号授权相关
任务配置相关
发起任务相关
任务结果查看相关
相关协议
Service Level Agreement
隐私协议
数据处理和安全协议
联系我们
词汇表

智能字幕模板

PDF
聚焦模式
字号
最后更新时间: 2026-03-10 17:03:31

操作场景

智能字幕功能可以将点播视频文件或直播流中的语音信息进行语音识别,将其转换成字幕并进行多语言翻译。其适用于直播实时字幕、视频转译出海等场景。您可以创建自定义智能字幕模板,针对不同应用场景预设不同的处理参数,以便于后续复用。




前提条件

1. 注册腾讯云 账户。

模板配置指引

1. 进入模板管理 > 媒体 AI 模板 > 智能字幕,系统提供了几种预设模板,您可以直接使用,也可以单击创建智能字幕模板来创建自定义模板。

2. 进入智能字幕模板创建页面,支持以下配置参数。

处理类型为“语音识别(ASR)生成字幕”


支持以下配置项:
配置项
说明
模板名称
仅支持中文、英文、数字、下划线(_)、短横线(-)和句点(.),长度不能超过64个字符。
处理类型
语音识别(ASR)生成字幕:输入需为音频或视频文件,通过ASR生成字幕文件并翻译。
翻译字幕文件:输入需为字幕文件,通过大模型翻译为多语种,生成新字幕文件。
当处理类型为「语音识别(ASR)生成字幕」
视频语音源语言
选择源视频语音的源语言。下文列出了 支持的源语言列表
关联语音识别热词库
语音中的常用词汇一般能够被准确识别,然而,对于特定的人名、产品名、公司名和行业专有词汇(如品牌名“智聆”、建筑名“滨海大厦”、保险领域的“核保”、云存储的“存储桶”等),识别准确率可能会降低。为了解决这个问题,我们提供了自定义热词库功能,您可以通过手动输入或文件导入的方式,添加专有词汇,以显著提升语音识别准确率。具体配置指引请参见 自定义热词库 文档。
注意:
目前热词库只支持中文普通话、英文语种,因此,只有当视频语音源语言为简体中文、英文时,才支持关联热词库。
是否开启翻译
开启后,支持将源语言字幕翻译成指定语言,适用于视频转译出海等场景。
说明:
部分语言暂未开放选择,如需使用,请 联系我们 获得支持。
翻译目标语言
字幕类型
若没有开启翻译功能,输出字幕只包含源语言内容。
当开启了翻译功能时,支持以下输出字幕类型:
单语(翻译语言)
双语(源语言 + 翻译语言)
字幕文件格式
当前支持 WebVTT 、SRT 格式。若您只需要字幕内容回调,不需要实际输出字幕文件,可以选择“不生成字幕文件”。

支持语言

处理类型为“文本识别(OCR)生成字幕”


支持以下配置项:
配置项
说明
模板名称
仅支持中文、英文、数字、下划线(_)、短横线(-)和句点(.),长度不能超过64个字符。
当处理类型为「文本识别(OCR)生成字幕」
字幕区域
框选待提取的字幕位置。预设区域默认为视频中部靠下部分。为避免漏提取,建议您切换到自定义,上传预览视频/图片,自定义框选字幕区域。
源语言
中英:表示源语言为中文、英文或中英混合;
其他:除中英之外的其他多语种。
是否开启翻译
开启后,支持将源语言字幕翻译成指定语言,适用于视频转译出海等场景。
说明:
部分语言暂未开放选择,如需使用,请 联系我们 获得支持。。
翻译目标语言
字幕文件格式
支持选择 WebVTT、SRT。
字幕类型
未开启翻译功能,字幕内容为单语(源语言)。
开启了翻译功能,字幕内容支持单语(翻译语言)或双语(两行字幕、源语言 + 翻译语言)。

支持语言

处理类型为“翻译字幕文件”


配置项
说明
模板名称
仅支持中文、英文、数字、下划线(_)、短横线(-)和句点(.),长度不能超过64个字符。
当处理类型为「翻译字幕文件」
源语言
默认“自动识别”,您也可以指定语种。下文列出了 支持的源语言列表
翻译目标语言
开启后,支持将源语言字幕翻译成指定语言,适用于视频转译出海等场景。下文列出了 支持的翻译目标语言列表
说明:
部分语言暂未开放选择,如需使用,请 联系我们 获得支持。
字幕文件格式
支持选择 WebVTT、SRT、与源文件一致。
字幕类型
支持以下选项:
单语(翻译语言):生成的翻译语言字幕文件为单行单语字幕。
双语(源语言 + 翻译语言):生成的翻译语言字幕文件为双行双语字幕。

支持语言

计费说明

语音识别(ASR)生成字幕

仅识别源语种,收取「语音识别」费用

处理类型选择「语音识别(ASR)生成字幕」,未开启翻译,将会收取「语音识别」费用,定价请参考 计费说明文档


翻译一个目标语种,收取「语音翻译」费用

处理类型选择「语音识别(ASR)生成字幕」,开启翻译,并选择了一个翻译目标语言,将会收取「语音翻译」费用,定价请参考 计费说明文档


翻译目标语种数量 > 1,每个额外语种收取「翻译字幕(附加语种)」费用

处理类型选择「语音识别(ASR)生成字幕」,开启翻译,并选择了 n 个翻译目标语言,将会收取「语音翻译」× 1 + 翻译字幕(附加语种)× (n-1) 费用。
以下面配置为例,将收取的费用为「语音翻译」× 1 + 翻译字幕(附加语种)× 3 。定价请参考 计费说明文档


文字识别(OCR)生成字幕

仅提取源语种,收取「OCR 提取字幕」费用

处理类型选择「文字识别(OCR)生成字幕」,未开启翻译,将会收取「OCR 提取字幕」费用,定价请参考 计费说明文档


翻译一个目标语种,收取「OCR 提取字幕并翻译」费用

处理类型选择「文字识别(OCR)生成字幕」,开启翻译并选择了一个翻译目标语言,将会收取「OCR 提取字幕并翻译」费用,定价请参考 计费说明文档


翻译目标语种数量 > 1,每个额外语种收取「翻译字幕(附加语种)」费用

处理类型选择「文字识别(OCR)生成字幕」,开启翻译,并选择了 n 个翻译目标语言,将会收取「OCR 提取字幕并翻译」× 1 + 翻译字幕(附加语种)× (n-1) 费用。
以下面配置为例,将收取的费用为「OCR 提取字幕并翻译」× 1 + 翻译字幕(附加语种)× 3 。定价请参考 计费说明文档


翻译字幕文件

翻译一个目标语种,收取「翻译字幕」费用

处理类型选择「翻译字幕文件」,并选择了一个翻译目标语言,将会收取「翻译字幕」费用,定价请参考 计费说明文档


翻译目标语种数量 > 1,每个额外语种收取「翻译字幕(附加语种)」费用

处理类型选择「翻译字幕文件」,并选择了 n 个翻译目标语言,将会收取 「翻译字幕」× 1 + 翻译字幕(附加语种)× (n-1) 费用。
以下面配置为例,将收取的费用为「翻译字幕」× 1 + 翻译字幕(附加语种)× 3 。定价请参考 计费说明文档

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈