
可实现功能 | 说明 |
适配更多终端 | 将原始视频转码成拥有更强的终端适配能力的格式(如 MP4),使视频资源能够在更多设备上播放。 |
适配不同带宽 | 将视频转换成流畅、标清、高清及超清等输出,用户可以根据当前网络环境选择合适码率的视频播放。 |
改善播放效率 | 转码可以将 MP4 位于尾部的元信息 MOOV 提前到头部,播放器无需下载完整视频即可立即播放。 |
节省带宽 | 采用更先进的编码方式(如 H.265)转码,在不损失原始画质的情况下显著降低码率,节省播放带宽。 |
参数 | 类型 | 详细说明 |
输入格式 | 封装格式 | 3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM、MXF。 |
| 视频编码格式 | AV1、AVS2、H.264/AVC、H.264 intra、H.263、 H.263+、H.265/HEVC、MV-HEVC、H.266/VVC、MPEG-1、MPEG-2、MPEG-4、MJPEG、VP8、VP9、RealVideo、Windows Media Video、WMV2、Quicktime。 |
| 音频编码格式 | AAC、ADPCM、AMR、DSD、MP1、MP2、MP3、PCM、RealAudio、Windows Media Audio、VORBIS、AC-3。 |
输出格式 | 封装格式 | 视频:FLV、MP4、HLS(m3u8+ts)、MXF。 |
| | 音频:MP3、MP4、OGG、FLAC、m4a、PCM。 |
| | 图片:GIF、WEBP。 |
| 视频编码格式 | AV1、H.264/AVC、H.264 intra、H.265/HEVC、MV-HEVC、H.266/VVC、MPEG-2、MPEG-4、MJPEG、VP8、VP9、RealVideo、Windows Media Video、WMV2。 |
| 音频编码格式 | MP3、AAC、FLAC、MP2、VORBIS。 |
封装 | 删除视频流 | 如果开启“删除视频流”,转码出来的视频将不包含视频流(仅保留音频流)。 |
| 删除音频流 | 如果开启“删除音频流”,转码出来的视频将不包含音频流(仅保留视频流)。 |
适用输入源 | 转码类型 | 描述 |
视频 | 普通视频转码 | 可以降低视频码率、改变原始码流的编码标准、分辨率和帧率等参数,从而适应不同终端和网络环境的播放。 |
| 极速高清转码 | 极速高清转码是普通视频转码的“升级”功能。能够对不同类型的视频做自适应优化处理,以更低的带宽给用户提供更高清的观看体验。在保证画质甚至提升画质的前提下,节省50%+带宽成本。 |
| 视频自适应码流 | 可以将输入的源视频文件转成多路适合不同场景下播放的码流,让用户可根据网络选择合适码率的视频播放,提升用户体验。 |
| 转封装 | 可以改变源视频文件的封装格式。 |
音频 | 普通音频转码 | 可以降低音频码率、改变编码标准、采样率和声道等参数,从而适应不同终端和网络环境的播放。 |
| 音频极速高清转码 | 音频极速高清转码是普通音频转码的“升级”功能。能够对不同类型的音频做自适应优化处理,以更低的带宽给用户提供更优质的音效体验。 |
| 音频自适应码流 | 可以将输入的源音频文件转成多路适合不同场景下播放的码流,从而适配不同网络条件,提升用户体验。 |

增强类型 | 能力 | 说明 |
视频增强 | 超分辨率 | 超分辨率可以识别视频的内容与轮廓,高清重建视频的细节与局部特征,将低分辨率的视频转换为高分辨率的视频,适用于老片修复等场景。 |
| 低光照增强 | 因环境状况及拍摄摄像头的硬件限制,在某些场景下拍摄的画面存在亮度和对比度缺失问题,导致画面较暗或细节缺失。通过开启低光照增强,可以大幅提升暗区的细节和对比度,提升人眼主观质量。 |
| HDR | 支持 HDR10、HLG,能够获得更宽的色域,展现更多色彩细节,以提供更高品质的视频内容。 |
| 综合增强 | 通过 AI 的综合分析能力,自动平衡画面中的纹理内容,在去除压缩伪影和毛刺的同时增强关键细节,从而提高整个画面的总体主观感受。 |
| 色彩增强 | 色彩增强可以使画面更接近真实色彩,并在一定程度上进行增强满足人眼的喜好。 |
| 细节增强 | 细节增强对视频中需要关注的细节(例如赛场草地)进行增强,使画面内容更清晰,内容更丰富。 |
| 人脸增强 | 通过人脸检测针对视频中人眼视觉特别关注的人脸部分进行增强,使该区域的细节更加清晰,提高主观感受。 |
| 去划痕 | 去划痕可以修复视频中的划痕和雪花点等破坏的内容。 |
| 去毛刺(去伪影) | 由于影片在转码或多次转码过程中对视频进行了多次压缩,会引入块效应、振铃效应、色度渗透和蚊噪等,使得视频画面出现一些影响视觉效果的失真,去压缩失真能有效修复编码引入的失真。 |
| 字体增强 | 对画面中的文字内容进行处理,使文字边界更清晰,提高文字内容的可读性。 |
| 视频降噪 | 由于影片拍摄中会因为相机和环境引入随机噪点,这里提供降噪服务,在保持细节不损失的情况下,消除画面中的随机噪声。 |
音频增强 | 音频降噪 | 音频智能降噪,去除设备底噪、环境噪声等,适用于录制课程、户外拍摄后期等场景。 |
| 音频分离 | 分离音视频文件中人声与背景声,或者演唱声和伴奏声,生成独立音频素材,便于后期实现其他风格艺术加工。 |
| 音量均衡 | 1. 响度标准化:使整体响度水平保持一致,播放时听起来具有相似的音量,避免出现过于响亮或过于安静的问题,提供更好的听觉体验。 2. 音量突变抑制:平滑过于响亮的音频片段,避免出现音量突变的问题,提供更平稳的听觉体验。 |
| 音频美化 | 1. 杂音去除:减少音频中包含的不需要的杂音或干扰声,提高音频的质量和清晰度。 2. 齿音压制:齿音是指音频中尖锐的、刺耳的声音,通常可能由声音源接近麦克风时产生。压制齿音旨在减少或消除这种不自然的声音,从而改善音频质量。 |
参数 | 说明 |
水印类型(Type) | 支持静态图片水印和动态图片水印 |
水印位置(Position) | 水印在视频画面中的相对位置 |
图片大小(ImageSize) | 图片水印占视频画面的大小 |
图片内容(ImageContent) | 图片水印中图片的二进制内容 |
参数 | 说明 |
格式(Format) | 截图文件的输出格式,目前仅支持 JPG |
宽度(Width) | 截图宽度,范围是128px - 4096px |
高度(Height) | 截图高度,范围是128px - 4096px |
填充方式(FillType) | 当截图的宽高比与原始视频的宽高比不一致时,对截图的处理方式,即为“填充”。一般有以下几种填充方式: 拉伸:对图片进行拉伸,填满整个图片,可能导致图片被“压扁”或者“拉长” 留黑:保持图片宽高比不变,边缘剩余部分使用黑色填充 留白:保持图片宽高比不变,边缘剩余部分使用白色填充 高斯模糊:保持图片宽高比不变,边缘剩余部分使用高斯模糊化后填充 |
参数 | 说明 |
格式(Format) | 截图文件的输出格式,目前仅支持 JPG |
宽度(Width) | 截图宽度,范围是128px - 4096px |
高度(Height) | 截图高度,范围是128px - 4096px |
采样方式(SampleType) | 采样方式分为两种: 按百分比采样:例如按照5%为间隔采样,生成截图张数将为20张 按时间间隔采样:例如按照10s为间隔采样,截图张数取决于视频的时长 |
采样间隔(Interval) | 采样的间隔长度: 如果按百分比采样,间隔是百分比 如果按时间间隔采样,间隔是多少秒 |
填充方式(FillType) | 当截图的宽高比与原始视频的宽高比不一致时,对截图的处理方式,即为“填充”。一般有以下几种填充方式: 拉伸:对图片进行拉伸,填满整个图片,可能导致图片被“压扁”或者“拉长” 留黑:保持图片宽高比不变,边缘剩余部分使用黑色填充 留白:保持图片宽高比不变,边缘剩余部分使用白色填充 高斯模糊:保持图片宽高比不变,边缘剩余部分使用高斯模糊化后填充 |
参数 | 说明 |
格式(Format) | 雪碧图文件的输出格式,目前仅支持 JPG |
小图宽度(Width) | 雪碧图中小图的宽度 |
小图高度(Height) | 雪碧图中小图的高度 |
小图行数(Rows) | 一张大图中有多少行小图 |
小图列数(Columns) | 一张大图中有多少列小图 |
采样方式(SampleType) | 小图采样方式,目前仅支持按照时间间隔采样 |
采样间隔(Interval) | 小图采样的间隔,即隔多久采样一张小图 |
参数 | 说明 |
格式(Format) | 动图文件的输出格式,目前仅支持 GIF 和 WEBP |
宽度(Width) | 动图宽度,范围是128px - 4096px |
高度(Height) | 动图高度,范围是128px - 4096px |
帧率(FPS) | 支持的帧率范围是1fps - 60fps |







识别类型 | 功能说明 |
人脸识别 | 基于深度学习方案,帮助客户快速识别视频中的人脸信息并快速定位出视频中的人物所在帧画面,以及人脸所在区域。客户可自定义人物库或调用视频 AI 公共人物库进行人脸识别。 |
语音识别 | 基于深度学习方案,帮助客户快速识别视频中的声音并转化成文字,支持客户自定义关键词且定位出关键词所在视频的时间点。 |
文字识别 | 帮助客户识别视频中出现的文字信息,可用于视频内自定义关键词的提取,也支持竖版文字的识别。 |
帧标签识别 | 基于深度学习方案,支持根据客户自定义视频截帧间隔,自动识别截帧画面内的标签,并定位标签所在的视频位置,帧标签涵盖人物、风景、人造物、建筑、动植物、食物等9个大类,包含日常生活的各个信息维度,并且支持在标签体系基础上使用自定义标签,具备迁移学习能力,只需提供原始用户数据便可定制分类器,满足不同类型的用户需求,使标签分类更具灵活性。 |
片头片尾识别 | 根据视频画面特征、文字、语音等信息自动识别定位电影/电视剧片头片尾时间点。 |
分析类型 | 能力说明 |
分类识别 | 通过分析视频内容,给视频推荐一个类别。目前支持美食、旅游、动漫、音乐等19大类(支持定制,需支付定制费)。 |
视频标签识别 | 基于腾讯深度学习方案,智能识别出最符合视频内容的前五项标签摘要,用于视频推荐、检索等场景,用户可在接口中自行选择返回的标签个数。 |
智能封面 | 结合视频画面纹理、场景识别等特征信息自动生成文件封面,支持静态封面输出,提升视频封面体验和点击转化率。 |
检测类型 | 检测项说明 |
视频画面审核 | 对视频画面做涉黄、违规检测,具体检测项如下: 涉黄检测 porn:色情 vulgar:低俗 intimacy:亲密行为 sexy:性感 违法违规检测 guns:武器枪支 bloody:血腥画面 explosion:爆炸火灾 violation_photo:违规图标 |
音频审核 | 对音频中的文字进行检测,具体检测项如下: 涉黄检测:对音频中的文字做涉黄检查,识别出嫌疑关键词。 违法违规检测:对音频中的文字做违法违规检查,识别出嫌疑关键词。 |
文字审核 | 对画面中的文字进行检测,具体检测项如下: 涉黄检测:对画面中的文字做涉黄检查,识别出嫌疑关键词。 违法违规检测:对画面中的文字做违法违规检查,识别出嫌疑关键词。 |

质检类型 | 检测类型 | 检测项说明 |
格式质检 | 点播视频格式质检 直播流格式质检 | 检测 DTS、PTS 问题、分辨率变化,采样率变化、丢帧、重复帧等格式问题。 |
无参考评分 | 视频无参考评分 | 根据多维度检测标准,对视频质量进行百分制打分。 |
质量审核 | 画面质量 | 支持对视频的画面质量做出检测,具体检测项如下: JitterResults:画面抖动。 BlurResults:画面模糊。 AbnormalLightingResults:低光、过曝。 CrashScreenResults:花屏 BlackWhiteEdgeResults:画面黑边、白边、黑屏、白屏、纯色屏时间段。 NoiseResults:画面有噪点。 MosaicResults:画面有马赛克。 QRCodeResults:画面有二维码。 |
| 声音质量 | 支持对视频的声音质量做出检测,具体检测项如下: VoiceResults:音频异常,包括静音、低音、爆音。 |
分类 | 功能 | 说明 |
点播视频 | 视频质量评测 | 添加原视频和对比视频,进行视频质量评测。 支持 VMAF、PSNR、SSIM 和 VMAF-NEG 评测方式。 可以自定义选取时间段或帧数范围评测。 |
| BD-Rate对比评测 | 选择媒体处理模板,评测不同模板在多种比特率下的视频转码质量差异。 支持 VMAF、PSNR、SSIM 和 VMAF-NEG 评测方式。 可以自定义选取时间段或帧数范围评测。 支持指定码率对比评测分数,或指定 CRF(视频质量分数)对比码率。 |
直播流 | 画面质量 | 实时对比和监控直播流转码前后的画面质量及码率变化。 |


参数 | 参数说明 |
单个TS时长 | 单个 TS 时长支持5秒 - 30秒。 |
录制周期 | 范围10分钟 - 720分钟,超过设定的录制周期后,将生成新的文件。 |
续录等待时长 | 范围60秒 - 1800秒,续录等待时长会直接影响录制文件生成的时间。 |
终端 SDK 类型 | 功能说明 |
终端视频编码 SDK | 腾讯极速高清终端视频编码器是一款针对端侧低算力、低延迟、高画质场景研发的编码器。和硬件编码相比,优势在于: 稳定可靠,启动快。 同等画质下节省码率,提升传输的稳定性,节省下行分发带宽,节省存储成本等。 同等码率下提升画质,提升用户体验。 丰富的功能,满足业务多样化需求,如使用 ROI 编码提升人脸区域画质,动态调整编码配置适应网络波动等。 |
终端音频SDK | 终端音频 SDK 包含标准版、专业版和旗舰版,支持如下功能: 声学回声消除 自动增益控制 自适应噪声抑制 回声消除音乐模式 音量均衡 AI智能降噪 音频编码 AI Codec |
终端增强SDK | 客户端增强 SDK,基于高效的图像处理算法和 AI 模型推理能力,实现终端视频超分辨率、画质增强、插帧等功能,包含标准版、专业版和旗舰版,支持如下功能: 标准超分辨率/专业超分辨率/标准超分+增强参数 AI 画质增强 AI 插帧增强 |
文档反馈