2D/3D形象 | 形象租赁 | 自定义专属的数智人形象,3D需额外购买云端驱动引擎,2D不需要;与租赁二选一购买。 | | |
定制形象续期 | 定制形象默认有1年有效期,该服务专用于定制形象到期后购买使用;租赁形象到期后,直接重新购买即可,不需要购买该续期服务。 | | | |
应用场景 | 会话互动 | 云渲染 | 通过云端服务来渲染生成形象后,将图像实时推送到终端展示,需购买“云渲染会话驱动并发”;支持 API 和 SDK,与端渲染互斥。 | |
| | 端渲染 | 在终端本地直接渲染生成形象展示,云端只负责推送会话内容,需购买“端渲染会话驱动次数包”或终端授权 license;支持 API 和 SDK,与云渲染互斥。 | |
| 音视频播报 | 生成视频(含音频) | 借助指定虚拟形象和音色,按照预设文本生成视频,需购买“视频播报合成小时包”(含音频合成能力)。 | |
| | 仅生成音频 | 借助指定音色,按照预设文本生成音频,需购买“音频播报合成小时包”(仅生成音频时需购买该小时包)。 | |
| | 音视频播报并发 | 通过增加并发路数来提高视频或音频的生成效率,对生成结果不影响,可选购买。 | |
声音定制 | 声音复刻 | 通过提供的声音素材,训练生成指定的音色。在应用场景中配合使用。 | | |
定制声音续期 | 复刻声音默认1年有效期,该服务专用于复刻声音到期后购买使用。 | | | |
形象类型 | 定义 | 使用场景 | 示例 |
2D精品 | 通过在专业影棚中录制动作素材,经过两周左右的训练可生成应用于播报、交互场景的数智人。精品形象可在文中随机插入指定动作,动作呈现多样性。 | 适用于金融、传媒类对数智人形象、动作有要求的客户。 | ![]() |
2D小样本-通用口型 | 适用于对数智人口型无要求、无良好拍摄条件的客户。 | ![]() | |
2D小样本-专属口型 | 适用于对数智人形象复刻有要求、有较好拍摄条件的客户。 | | |
2D小样本-高精版本 | 适用于大型会议、面对面对话、产品发布会、大屏场景。 | | |
2D小样本-照片数智人 | 通过一张照片即可训练数智人;该版本主打低价快速,从素材提交后,一般情况下在10分钟后即可使用。 | 适用于泛互、娱乐场景。 | ![]() |
3D卡通 | 根据客户的需求设定数智人五官特征、发型、服饰、配饰等完成原画,待客户评审后敲定最终形象后进行模型制作。后经过骨骼绑定、渲染、UE调优等阶段后可输出覆盖交互、播报场景的数智人。 | 适用于已有2D吉祥物形象,期望升级为3D形象为用户提供服务的场景。 | ![]() |
3D半写实 | 根据客户的需求设定数智人五官特征、发型、服饰、配饰等完成原画,待客户评审后敲定最终形象后进行模型制作。后经过骨骼绑定、渲染、UE调优等阶段后可输出覆盖交互、播报场景的数智人。 | 适用于需要一定的写实感但精度要求不高的场景,如资讯播报、手机端智能客服场景。 | ![]() |
3D写实 | 根据客户的需求设定数智人五官特征、发型、服饰、配饰等完成原画,待客户评审后敲定最终形象后进行模型制作。后经过骨骼绑定、渲染、UE调优等阶段后可输出覆盖交互、播报场景的数智人。 | 适用于需要高写实感和高精度展现的场景,如品牌宣传、大屏交互场景。 | ![]() |
| 2D小样本-通用口型 | 2D小样本-专属口型 | 2D小样本-高精版本 | 2D小样本-照片数字人 |
录制要求 | 录制至少60s的视频,对于视频拍摄声音无要求 | 录制至少180s的视频,录制环境需要保持安静,仅可录制拍摄主体的声音 | 录制标准同专属口型,视频分辨率需是4K | 仅需要提供一张人物清晰正面照片 |
交付周期 | 1天内出demo供客户效果确认,客户点击确认后即可使用 | 2天内出demo供客户确认效果,客户点击确认后即可使用 | 3天内出demo供客户确认效果,客户点击确认后即可使用 | 10分钟内即可使用 |
成品效果 | 通用版本使用的为大数据模型生成的唇齿 | 专属版本为录制本人的口型,面部清晰度更优 | 在专属口型的效果基础上,输出4K分辨率,更加高清 | 照片数智人使用的为大数据模型生成的唇齿,身体姿态无法轻微晃动 |
通用口型 vs 专属口型 | ![]() | | | |
通用口型 vs 照片数字人 | ![]() | | | |
专属口型 vs 高精版本 | ![]() | | | |
形象类型 | 功能描述 | 价格 |
2D 小样本通用口型 | 在 2D 小样本通用口型形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。 | 25美元/个/月 |
2D 小样本专属口型 | 在 2D 小样本专属口型形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。 | 60美元/个/月 |
3D | 在 3D 形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。 | 5358美元/个/月 |
形象类型 | 功能描述 | 价格 |
2D小样本通用口型 | 限云服务。支持文本及原声驱动。 通过提供1段1分钟视频素材即可定制数字人,含1个默认音色。 服装造型、姿态、动作均以视频素材数据为准。 素材为绿幕纯色背景的,方可支持背景更换功能。 | 200 美元/个 |
2D小样本专属口型 | 支持文本驱动或原声驱动。 通过提供1段3分钟视频素材即可定制播报数字人,含1个默认音色。 服装造型、姿态、动作均以视频素材数据为准。 素材为绿幕纯色背景,方可支持背景更换功能。 | 1,000 美元/个 |
2D小样本照片 | 支持文本驱动或原声驱动。 通过一张照片即可训练数智人,成本低,定制速度快速。 | 2.5美元/个 |
3D | 不限云服务、私有化使用。 支持文本/声音驱动/单目摄像头视频驱动,基于默认版3D人像(参考哟哟形象身体模板),针对脸型、发型、服装、动作按指定的要求进行客制化,成套模型包含脸型*1、发型*1、服装*1,动作库8个。 如需额外的发型、服装、动作、表情定制,需增项加购。 3D写实配套资产精度为S级别。 | 请联系我们,获取报价 |
3D云端驱动引擎 | 适用于客户已有并且满足驱动规范的 3D 形象资产,支持文本驱动或原声驱动。 | 137,500美元/个 |
类别 | 功能描述 | 价格 |
声音复刻-极速版 | 2.5美元/个 | |
声音复刻-极速版(小语种) | 50美元/个 |
形象类型 | 功能描述 | 价格 |
2D 形象专属口型 | 支持对 2D 小样本专属口型的定制形象进行在架服务续期。 | 18美元/个/月 |
2D 形象通用口型 | 支持对 2D 小样本通用口型的定制形象进行在架服务续期。 | 2美元/个/月 |
3D 形象 | 支持对 3D 卡通、3D 半写实、3D 写实的定制形象进行在架服务续期。 | 84美元/个/月 |
声音极速小语种 | 支持对声音复刻的极速小语种版音色进行在架服务续期。 | 4美元/个/月 |
形象类型 | 功能描述 | 价格 |
2D小样本通用口型 | 数智人租赁/复刻声音视频生成时长10小时 | 1800美元/个 |
2D小样本专属口型 | 数智人租赁/复刻声音视频生成时长10小时 | 1800美元/个 |
2D小样本照片数智人 | 数智人租赁/复刻声音视频生成时长10小时 | 1800美元/个 |
3D | 数智人租赁/复刻声音视频生成时长10小时 | 3600美元/个 |
形象类型 | 功能描述 | 价格 |
2D 小样本免训练(视频素材) | 视频播报合成小时包-免训练版10小时 | 4,500美元/个(10小时) |
2D 小样本免训练(照片素材) | 视频播报合成小时包-免训练版1小时 | 2,000美元/个(1小时) |
小时包类型 | 功能描述 | 价格 |
通用音频播报合成 | 限云服务,数智人租赁/复刻声音音频生成时长1小时包 | 10美元/个 |
形象类型 | 功能描述 | 价格 |
2D小样本通用口型 | 支持2D小样本通用口型,分辨率最高1080p。 | 500美元/月/路 |
2D小样本专属口型 | 支持2D小样本专属口型,分辨率最高1080p。 | 500美元/月/路 |
2D小样本照片 | 支持2D小样本照片,分辨率最高1080p。 | 500美元/月/路 |
3D | 支持3D,分辨率最高1080p。 | 800美元/月/路 |
2D 小样本免训练(视频素材) | 支持 2D 小样本免训练(视频素材),分辨率最高1080p。 注:与照片素材不可混用,可代替对应小时包 | 2,000美元/路/月 |
2D 小样本免训练(照片素材) | 支持 2D 小样本免训练(照片素材),分辨率最高1080p。 注:与视频素材不可混用,可代替对应小时包 | 2,000美元/路/月 |
形象类型 | 功能描述 | 价格 |
2D小样本通用口型 | 支持2D小样本通用口型,分辨率最高1080p。 | 500美元/月/路 |
2D小样本专属口型 | 支持2D小样本专属口型,分辨率最高1080p。 | 500美元/月/路 |
2D小样本照片 | 支持2D小样本照片,分辨率最高1080p。 | 500美元/月/路 |
3D | 支持3D,分辨率最高1080p。 | 800美元/月/路 |
形象类型 | 产品内容 | 功能描述 | 价格 |
2D | 2D 端渲染 SDK 授权使用年包-按设备 | 支持通用口型、专属口型和照片等类型数字人,针对单台设备授权方式进行售卖。 | 1,200美元/年 |
| 2D 端渲染 SDK 授权使用年包-按应用 | 支持通用口型、专属口型和照片等类型数字人,按应用授权,包含 iOS 和 Android,不限制终端用户数量。 | 150,000美元/年 |
3D | 3D 端渲染 SDK 授权 H5 | 用于对 SDK 进行授权,购买一次,终身可用。H5 版 SDK 需要搭配 WebGL 形象使用。必选。(线下购买,含1年维保) | 34,287美元/个 |
| 3D 端渲染会话驱动次数包 | 用于统计3D端 SDK 的调用次数。单包支持100万次调用,按 GBK 编码,40字节=1次(即20个汉字算1次消耗),有效期自购买之日一年内。必选 | 2,000美元/个 |
文档反馈