tencent cloud

腾讯云智能数智人

产品简介
产品概述
产品功能
产品优势
购买指南
价格指南
购买指引
使用代金券购买流程
退费说明
数智人形象介绍
形象类别介绍
基础形象库
形象和声音复刻指引
数智人平台操作指引
访问平台
形象生产与资产管理
数智人会话互动应用与管理
播报数智人视频生成与管理
运营管理与分析
服务端 API 接入
数智人 API 接入模式概述
数智人 aPaas 接口调用方式
2D真人小样本形象、声音定制 API 文档
视频生成服务 API 文档
交互数智人服务 API 文档
个人资产管理 API 文档
客户端 SDK 接入
整体介绍
3D 端渲染 SDK 接入
2D 端渲染 SDK 接入
数智人 SSML 标记语言规范
相关协议
隐私协议
DSA(Data Sharing Agreement)
常见问题

数智人话术管理

PDF
聚焦模式
字号
最后更新时间: 2024-10-29 11:28:30
话术管理模块可以基于数智人播报的内容(即话术),来配置数智人动作、语音、UI交互等各种配置。目前支持三类对话服务:
使用腾讯行业大模型(即大模型知识引擎)
使用云小微对话服务
使用其他对话服务(即数智人仅支持驱动服务,不含NLP服务)

以下将分别展开讲解相应的操作指引。

1. 话术管理-使用腾讯行业大模型(即大模型知识引擎)

使用腾讯行业大模型对话服务支持按场景指令配置话术。根据您的应用需求在此自定义场景,并配置各场景对应的指令、数智人动作&语音、特殊交互样式,配置内容将通过交互服务下发到应用端。

1.1 话术配置

添加话术
编辑问题以及相应答案,答案会自动同步至话术部分,可在话术编辑窗进行停顿/连续/动作等相应文本设置
预览:点击后出现预览窗口,可以查看为答案配置话术的播报效果。
注意:
1. 创建项目时若在对话文本模型创建方式选择了“输入appkey”绑定,则只有大模型应用调用权限、无编辑权限,即不可在数智人平台上被授权托管使用话术配置;
2. 话术自动同步答案文本,在话术编辑窗不可进行文本修改,仅可编辑数智人动作、发音等;




导入与导出
导入:可进行问答批量导入,下载模版填写完成后进行上传,单次仅允许上传单个文件,添加后可在列表查看,列表页入库方式显示为手动添加



导出:会以 xlsx 文件的形式导出,支持列表选择后批量导出以及全部导出


1.2 对话管理(直接创建大模型应用或绑定已有大模型应用可用)

能够进行文档的导入以及相应对话的测试;
若选择使用 appkey 绑定则可以查看相应大模型应用中已经配置好的部分,但无法进行新增/导入等编辑功能;




1.3 按场景指令配置列表页

根据应用需求在此自定义场景,并配置各场景对应的指令、数智人动作&语音、特殊交互样式,配置内容将通过交互服务下发到应用端。




1.4 动作标签使用说明

对于带动作的数智人,支持动作编辑能力。可以通过在文本中插入该形象对应的动作标签,从而可实现在播报对应位置内容时展现指定的动作。以下为插入动作的多种方法;
在话术配置页面的编辑话术部分进行【智能动作】自动识别段落文字并插入智能动作
在话术管理页面的“动作&语音配置”部分进行可视化的动作插入
在请求的话术中,人工增加动作标签,实现数智人的动作效果。
动作标签生效语法:<insert-action type="动作标签英文"/>
语法案例:你好,我是由人工智能驱动的数智人<insert-action type="waving_hand"/>,很高兴见到大家!我能像真人一样与人互动沟通,希望大家喜欢我。我模拟人类<insert-action type="sorry"/>说话时的声音、嘴唇动作和表情,并且将三者自然匹配,与真人几乎一致。

插入动作标签的注意事项:
由于单个动作时长3~5s,其中动作预计占2s左右,动作前后各有1s左右的过渡时间,因此动作前后需要预留相应时长的文字,才能保证动作的完整性。
注意:
在话术管理页面插入动作时,会实时请求tts,根据音色、语速计算预留文字的时长,从而判断能否插入动作。根据不同的音色、语速,预留的字数不同,一般来说:
1. 第1个动作前面、最后1个动作后,需有15个字。
2. 2个动作间,间隔30个字。


1.5 互动调优

可以在互动界面中输入问题验证效果,并且标记当前问答,稍后下载处理问答表导入大模型平台编辑问答文本。





2. 话术管理-使用云小微对话服务

当“使用云小微对话服务”时,在apaas实时调用过程中,如果遇到话术管理里不存在的话术,自动添加到话术管理中。
当“使用其他问答库对话服务”时,可通过接口里的入参(EnhanceText)来控制是否使用话术管理页面。
枚举值是:
➢ 0;为该参数的默认值,即不使用话术管理模块。
➢ 1;使用话术管理模块。
下图是交互数智人服务的整个调用流程,其中话术管理页面的作用见下图箭头处:





2.1 话术管理列表页




话术管理列表页的主要功能项包括:
添加回复语:支持人工添加,可单个输入、批量导入;支持自动添加,在数智人实时调用过程中,自动将新的话术自动入库。

话术管理列表页各个字段的含义:
入库方式:包含 手工添加、自动添加两种情况。
a.手工添加:即用户在该页面手工逐条或批量添加。
b.自动添加:指的是实时调用过程中,如果遇到话术管理里不存在的话术,自动添加到话术管理中。
回复语类型: 对于“使用云小微对话服务”来说,枚举值是对话服务里该话术的具体类型:包含闲聊、知识问答、任务型、其他。(对于“使用其他问答库对话服务”来说,取值默认为“其他”)
累计调用次数:即该话术被实际调用(即被数智人播报)的次数。
渲染情况:
a.如果该话术有预渲染的视频,则显示蓝色字体的“详情”,可以点击查看,交互同“预览”页面。
b.如果该话术没有预渲染,则显示黑色字体的“未渲染”,不能点击。

2.2 话术管理编辑页




配置回复语:
a) 当前内容来源:对应“云小微对话服务”里的回复语类型,包含“寒暄库”“问答知识库”“场景化问答”。
b) 数智人回复语:
内容来源
对应内容
寒暄库
能通过模糊搜索,拉取寒暄库里的“自定义寒暄”里配置的答案
问答知识库
能通过模糊搜索,拉取“问答知识库”里配置的答案
场景化问答
能通过模糊搜索,拉取“场景化问答”里配置的答案



动作&语音配置
支持对回复语进行语音、动作标注,可进行实时的效果预览。



UI交互配置
支持对回复语配置一些UI样式标注,选择题、图片等特殊的样式。这些配置需要业务系统读取这里的配置进行差异化的呈现.




下图是在小程序扫码体验时,选择题、图片和视频的效果。




2.3 按场景指令配置列表页

根据应用需求在此自定义场景,并配置各场景对应的指令、数智人动作&语音、特殊交互样式,配置内容将通过交互服务下发到应用端。








帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈