tencent cloud

腾讯云智能数智人

产品简介
产品概述
产品功能
产品优势
购买指南
价格指南
购买指引
使用代金券购买流程
退费说明
数智人形象介绍
形象类别介绍
基础形象库
形象和声音复刻指引
数智人平台操作指引
访问平台
形象生产与资产管理
数智人会话互动应用与管理
播报数智人视频生成与管理
运营管理与分析
服务端 API 接入
数智人 API 接入模式概述
数智人 aPaas 接口调用方式
2D真人小样本形象、声音定制 API 文档
视频生成服务 API 文档
交互数智人服务 API 文档
个人资产管理 API 文档
客户端 SDK 接入
整体介绍
3D 端渲染 SDK 接入
2D 端渲染 SDK 接入
数智人 SSML 标记语言规范
相关协议
隐私协议
DSA(Data Sharing Agreement)
常见问题

概述

PDF
聚焦模式
字号
最后更新时间: 2024-09-18 20:42:13

产品介绍

提供3分钟视频,即可快速生成和真人一模一样的数智人分身,五官、动作、表情完全模仿真人。您仅需要输入文字或声音,即可快速生成数智人播报视频。

说明:
定制形象最终效果与提供的视频里的人物的妆容肤色、表情动作基本一致,同时也会保留原视频中的光线。若有美颜、调亮等需求,可以在原视频上做美化处理,上传的原视频需要调整到满意状态。

流程指引





1. 准备视频/音频素材

形象定制:即可快速生成和真人一模一样的数智人分身,五官、动作、表情完全模仿真人。

方式一:录制素材
方式二:使用现有素材
要求
按照形象定制指引录制3-5mins视频,录制及后期可参见拍摄及后期制作指引
使用视频长度1分钟以上的现有口播视频(未剪辑版)
需注意
视频画面:人脸清晰不模糊,人脸区域放大后边缘轮廓清晰,画面稳定无晃动 模特表现:眼睛正视镜头,无大幅转头、偏头,脸部全程无遮挡 拍摄要点:视频开头静默闭口1-3秒,整条视频全程无剪辑、跳帧,全长须超过3分钟 环境声音:无其他人声掺入,无明显环境噪声,视频音画同步(声音与口型可对应)
此种方式不支持更换背景,与原视频保持一致
声音复刻: 快速生成和本人声音一致的音色。
录制100句音频(一般15分钟-20分钟),推荐 wav 无损压缩格式。
说明:
暂不支持单独复刻声音,需要搭配形象定制共同定制。

2. 准备个人形象定制授权书

为保障客户及定制人的合法权益,根据《互联网信息服务深度合成管理规定》规定,需要采取相应措施确保已取得用户合法授权同意。客户取得用户授权后,方可通过线上接口或线下方式向腾讯云提供授权材料。每个形象都需要配套提交本人的授权材料,可支持提交视频口述授权、书面材料授权两种授权模式(优选同时提供两种授权模式)。
授权文件模板点击可下载:形象授权书

3. 提交视频/音频素材文件

提交前需要进行素材自查要求,定制素材自查通过后,可通过API接口和数智人平台2种方式提交素材进行训练。
具体指引可参见定制材料提交指引

4. 定制效果确认及服务使用

可通过接口文档中的 2D真人小样本形象、声音定制 API 文档,查询小样本的定制进度,通过播报或直播 apaas 接口可进行服务使用。


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈