动态与公告
- 产品动态
- 产品公告
产品简介
购买指南
- 计费说明
- 购买指引
- 续费说明
- 欠费说明
- 退费说明
快速入门
控制台指南
- 概览
- 创建任务
- 任务管理
- 编排管理
- 模板管理
- 资源包管理
- 视频评测
- AIGC 内容生成
- 终端 SDK
- 字幕编辑工具
- 用量统计
- 访问管理示例
接入教程
- 音视频转码接入
- 音视频增强接入
- 音频分离接入
- 数字水印及明水印接入
- 媒体 AI 接入教程
- 媒体质检接入
- 终端 SDK 接入
- 直播流录制接入
- DRM 接入
- 其他接入教程
场景实践教程
API 文档
- History
- Introduction
- API Category
- 调用方式
- 发起处理任务相关接口
- 任务管理相关接口
- 转码增强模板相关接口
- 水印模板相关接口
- 截图模板相关接口
- 媒体AI模板相关接口
- 媒体AI-热词库相关接口
- 媒体AI-样本管理相关接口
- 媒体质检模板相关接口
- 直播录制模板相关接口
- 编排管理相关接口
- 数据统计相关接口
- 媒体传输-安全组管理相关接口
- 解析事件通知相关接口
- AI创作相关接口
- 图片处理模板相关接口
- Media AI – Episode Management APIs
- Media AI – Dubbing APIs
- 其他接口
- Data Types
- Error Codes
其他说明文档
- WebSocket 识别协议
常见问题
相关协议
联系我们
词汇表

大模型视频摘要接入

Download

聚焦模式

字号

最后更新时间： 2025-08-20 17:48:58

免费体验
说明：
体验馆功能较简单，仅用于体验基础效果，测试完整效果请使用 API 接入。
1. 打开 体验馆，进入 LLM Summarize 体验页，选择离线视频（Offline File）或直播流（Live Streaming），单击开始处理（One-Click Processing）。
2. 等待处理完成后即可查看结果。
﻿
API 接入
发起摘要任务
调用 媒体处理接口 ，选择 AiAnalysisTask 任务，将 Definition 设置为 22（预设大模型视频摘要模板）。ExtendedParameter 填额外的扩展参数，通过该参数实现特定的能力，取值详情见下文 扩展参数说明。
﻿
﻿
﻿
示例：
{
    "InputInfo": {
        "Type": "URL",
        "UrlInputInfo": {
            "Url": "https://facedetectioncos-1251132611.cos.ap-guangzhou.myqcloud.com/video/xxx.mp4" // 替换成需要摘要的视频 URL
        }
    },
    "AiAnalysisTask": {
        "Definition": 22, //预设大模型视频摘要模板 ID
        "ExtendedParameter": "{\\"des\\":{\\"split\\":{\\"method\\":\\"llm\\",\\"model\\":\\"deepseek-v3\\"}}}"
    },
    "OutputStorage": {
        "CosOutputStorage": {
            "Bucket": "test-mps-123456789",
            "Region": "ap-guangzhou"
        },
        "Type": "COS"
    },
    "OutputDir": "/output/",
    "TaskNotifyConfig": {
        "NotifyType": "URL",
        "NotifyUrl": "http://qq.com/callback/qtatest/?token=xxxxxx"
    },
    "Action": "ProcessMedia",
    "Version": "2019-06-12"
}
API Explorer 快速验证
您可以通过 API Explorer 实现快速验证，进入页面填写相关参数信息后即可发起 API 在线调用。
扩展参数说明
ExtendedParameter 用于对摘要任务进行个性设置，可先不填，结合默认效果，对需要改进方向按需使用。
注意：
API Explorer 会自动转换，ExtendedParameter 填写对应 json 即可，不用转换成字符串。如果是直接调用 API，那么需要对 json 字符串转义。
ExtendedParameter全部可选参数及其说明参考下表：
{
    "des": {
      "split": {
          "method": "llm", 
          "model": "deepseek-v3", 
          "max_split_time_sec": 100, 
          "extend_prompt": "本视频为医疗场景视频，按照医疗相关知识点对视频进行分段"
      },
      "need_ocr": true,
      "ocr_type": "ppt",
      "only_segment": 0,
      "text_requirement": "摘要在40字以内",
      "dstlang": "zh"
    }
}
﻿
参数
是否必填
类型
说明
split.method
No
string
视频分段方法，llm 表示大模型分段，nlp 表示传统 nlp 分段，默认为 llm。
split.model
No
string
分段大模型，可选 hunyuan，deepseek-v3，deepseek-r1，默认为 deepseek-v3。
split.max_split_time_sec
No
int
强制指定最大分段时间，单位秒。建议必要情况下再使用，可能影响分段效果。默认3600。
split.extend_prompt
No
string
补充大模型分段任务提示词，如“本视频为教学视频，按照相关知识点对视频进行分段”。建议先不填进行测试，效果不达预期时再补充。
need_ocr
No
bool
是否使用 ocr 辅助分段，true 表示开启，默认为 false。
不开启，系统仅识别视频语音内容辅助视频分段；开启，还会识别视频画面上的文字内容辅助视频分段。
ocr_type
No
string
ocr 辅助类型，ppt 表示将画面作为 ppt，按 ppt 翻页进行视频分段，other 表示其他，默认为 ppt。
only_segment
No
int
是否只分段，不生成摘要，默认为0。
1：只分段，不生成摘要。
0：分段且生成摘要。
text_requirement
No
string
补充大模型摘要任务提示词。例如限制字数"摘要在40字以内"。
dstlang
No
string
视频语言，用于视频语音识别与摘要相关结果语言指定，默认为"zh"。
"zh"：中文
"en"：英文
查询任务结果
任务回调：在使用 ProcessMedia 发起媒体处理任务时，可以通过 TaskNotifyConfig 参数设置回调信息。当任务处理完成后，会通过配置的回调信息回调任务结果，您可以通过 ParseNotification 解析事件通知结果。
使用 ProcessMedia 返回的 TaskId 调用 查询任务详情 接口查询任务处理结果。解析 WorkflowTask > AiAnalysisResultSet > DescriptionTask > Output > DescriptionSet > MediaAiAnalysisDescriptionItem 即可。
﻿
Description 对应整个视频摘要，Paragraphs 对应整个视频的智能分段结果以及每个分段的摘要。

帮助和支持

本页内容是否解决了您的问题？

您也可以联系销售或提交工单以寻求帮助。

填写满意度调查问卷，共创更好文档体验。

文档反馈

参数	是否必填	类型	说明
split.method	No	string	视频分段方法，llm 表示大模型分段，nlp 表示传统 nlp 分段，默认为 llm。
split.model	No	string	分段大模型，可选 hunyuan，deepseek-v3，deepseek-r1，默认为 deepseek-v3。
split.max_split_time_sec	No	int	强制指定最大分段时间，单位秒。建议必要情况下再使用，可能影响分段效果。默认3600。
split.extend_prompt	No	string	补充大模型分段任务提示词，如“本视频为教学视频，按照相关知识点对视频进行分段”。建议先不填进行测试，效果不达预期时再补充。
need_ocr	No	bool	是否使用 ocr 辅助分段，true 表示开启，默认为 false。不开启，系统仅识别视频语音内容辅助视频分段；开启，还会识别视频画面上的文字内容辅助视频分段。
ocr_type	No	string	ocr 辅助类型，ppt 表示将画面作为 ppt，按 ppt 翻页进行视频分段，other 表示其他，默认为 ppt。
only_segment	No	int	是否只分段，不生成摘要，默认为0。 1：只分段，不生成摘要。 0：分段且生成摘要。
text_requirement	No	string	补充大模型摘要任务提示词。例如限制字数"摘要在40字以内"。
dstlang	No	string	视频语言，用于视频语音识别与摘要相关结果语言指定，默认为"zh"。 "zh"：中文 "en"：英文

tencent cloud

媒体处理

大模型视频摘要接入

免费体验

API 接入

发起摘要任务

API Explorer 快速验证

扩展参数说明

查询任务结果

帮助和支持