创建应用后,进入应用设置页面,可对应用模型、知识库、输出配置等进行设置。本文以标准模式应用为例,详细介绍应用配置相关操作。
编辑应用
创建应用后,单击左上角应用图标,支持在编辑应用弹窗中修改应用图标、应用名称、应用简介在内的基础信息,也可进行应用模式的切换。各模式详情请参见 智能体应用及其三种模式。 设置完成后,设置页将随应用模式的不同有所区别,具体请参考下表:
|
基础设置 | 应用名称、应用头像和开场白。不同模式保持一致。 |
|
|
应用设置 | 不同模式的应用设置保持独立,模式切换时设置内容不继承。 | 不同模式的应用设置保持独立,模式切换时设置内容不继承。 单工作流模式不支持提示词、插件等设置项。 | 不同模式的应用设置保持独立,模式切换时设置内容不继承。 Multi-Agent 模式与标准模式设置项范围基本一致,但是具体可选范围有差异。 |
应用图标和名称设置完成并发布后,将展示在用户端界面窗口中。
模型设置
注意:
多模态问答模型、多模态阅读理解模型、Prompt 改写模型、AI 一键优化模型在新建应用时,ADP 展示的默认模型,是 ADP 平台官方推荐的最佳实践模型,是经过大量场景验证的最优选型,不建议用户自行修改。用户自行修改后,可能造成端到端问答效果下降,请谨慎更换。
在模型设置中支持对应用运行中的模型进行模型配置。
1. 思考模型用于意图识别(标准模式)、任务规划和选择插件(Multi-Agent 模式)。
2. 生成模型用于阅读理解和总结并生成回复结果。
3. 多模态问答模型用于对应用对话中用户上传的图片进行理解。
4. 多模态阅读理解模型对于知识库检索召回的多问多图片段进行解析。
5. Prompt 改写模型用于解决多轮对话中的“上下文割裂”问题,将模糊、省略或依赖前文的用户输入,转化为大模型可精准理解的完整语义指令。
6. AI 一键优化模型用于对提示词、角色指令、工作流描述、工作流各节点提示词进行一键优化,同时也会用于工作流代码节点 AI 代码生成。
7. 实时文档解析模型,用于对用户在问答中上传的文档进行文档解析。
标准模式、单工作流模式可通过模型设置进行统一设置。
模型设置相关功能如下:
模型服务:腾讯云智能体开发平台新用户将自动获得一定量的免费额度,可通过选择不同种类的模型进行免费应用调试;根据测试结果,您进一步 购买 和使用。 上下文轮数:设置输入给大模型作为 prompt 的上下文对话历史轮数。轮数越多,多轮对话的相关性越高,但消耗的 tokens 也越多。
参数设置:
温度:控制生成文本的随机性和多样性。较高的值将使输出更加随机和富有创造性,适合诗歌创作等场景。较低的值将使输出更加集中和确定,适合代码生成等场景。
top_p:控制模型生成文本的多样性。top_p 是一种核采样方法,模型会考虑累计概率达到 top_p 阈值的最可能词汇。
最大输出长度:限制生成模型生成文本的最大长度。有助于控制 API 调用的成本和响应时间,并防止生成过长的无意义文本。
角色指令
用户提问后,应用将以“角色指令”中定义的任务角色给出回答。可以参照所给填写,限定模型回复的语种、语气等,目前腾讯云智能体开发平台已支持中英文问答输出。
版本:支持将当前提示词草稿保存为一个版本,并填写版本说明。已保存的版本可以在查看版本记录里进行查看和复制,版本记录仅会展示当前所在提示词框下创建的版本。支持在内容对比中选择两个版本,查看它们的提示词内容差异。
模板:设定好的角色指令格式模板,建议按照模板填写,指令遵循效果更佳。编写指令后也可以点击模板 > 保存为模板 将编写好的指令存为模板。
AI 一键优化:初步完成角色设定后,可单击一键优化对角色设定内容进行优化,模型将基于已输入的内容优化设定,能够使模型更好地完成对应要求。
注意:
AI 一键优化功能将消耗用户的 tokens 资源。
欢迎语
填写欢迎语后,将在客户端侧首页显示,支持插入应用级变量显示。可以使用 AI 一键优化生成欢迎语。
知识库
知识库是进行知识导入、处理、维护的模块。
智能体开发平台产品中,将知识库分为默认知识库和知识库。
默认知识库:一个应用中只有一个默认知识库,默认知识库只能被当前应用使用,不支持被其他应用使用。
知识库:相同的主账号下,支持知识库与应用的灵活关联:一个知识库既可以被多个应用共用,一个应用也可以引用多个知识库。支持在“知识库”中创建和维护知识库,在应用下的知识管理中引用知识库使用。
知识库下支持回显该应用下默认知识库及引用知识库。并支持对每个知识库分别设置:检索召回、检索范围、知识库模型。
1. 检索召回:
检索策略:可选择混合检索、语义检索策略。
混合检索:同时执行关键词检索和向量检索,推荐在需要对字符串和语义关联的场景下使用,综合效果更优。
语义检索:推荐在 query 与文本切片重叠词汇少,需要语义匹配的场景。
Excel 检索增强:开启情况下,支持基于自然语言对 Excel 表格进行查询和计算,但可能影响应用回复耗时。
结果重排序:开启情况下,可选择重排序模型。在检索召回后的结果重排过程中,通过分析用户问题,重新调整切片顺序,使与用户问题相似度最高的内容排在前面。平台提供2个预置重排序模型,也可前往模型广场配置第三方重排序模型。
文档:开启情况下,大模型将基于您构建的文档库回答问题,可选择直接上传文件,或上传网页,大模型将解析、学习您上传的文档。文档相关内容可查看 文档概述。 文档召回数量:检索返回的最高匹配度的 N 个文档片段作为输入提供给大模型进行阅读理解。
文档检索匹配度:根据设置的匹配度,将找到的文本片段返回给大模型,作为回复参考。值越低,意味着更多的片段被召回,但也可能影响准确性,低于匹配度的内容将不会被召回。
问答:开启情况下,大模型将基于您构建的问答库回答问题,可选择直接上传文件批量导入问答、手动录入问答内容、从文档库的文件中自动生成问答。问答相关内容可查看 问答。 问答库答案回复:可选择直接回复和润色后回复。
直接回复:检测到的问题相似度高于参考值时,使用答案直接回复。
润色后回复:检测到答案后,将对答案进行润色后回复。
问答召回数量:检索返回的最高匹配度的 N 个问答作为输入提供给大模型进行阅读理解。
问答检索匹配度:根据设置的匹配度,将找到的问答内容返回给大模型,作为回复参考。值越低,意味着更多的片段被召回,但也可能影响准确性,低于匹配度的内容将不会被召回。
数据库:开启情况下,大模型将基于您接入的第三方数据库回答问题。
2. 检索范围:实现不同用户咨询回复给出不同知识范围的答案。详情可查看 知识库检索相关设置。 工作流
工作流用于复杂业务场景交互,可在工作流管理页控制流程启用状态。工作流配置流程及介绍请查看 什么是工作流? 对话体验
聊天背景
支持为聊天界面配置背景样式。点击设置按钮后,可上传自定义背景图片,支持上传本地文件或从灵感图库选择。
1. 上传本地文件或从灵感图库选择背景图片。
2. 设置效果预览,支持查看 Web 效果和移动端效果并设置气泡配色。
3. 单击确定,聊天背景设置成功。
逐字回复
开启后,大模型回复将以流式输出方式展示,即内容按生成过程逐字呈现;关闭后,回复将在完整生成后一次性输出。
兜底回复
开启后,当用户提问超出已配置的知识来源范围时,大模型将按照此处填写的兜底内容进行回复,避免出现无法回答的情况。
推荐问题
开启后,在完成当前问题回复后,大模型将基于 Prompt 内容,自动生成最多 3 条推荐追问问题,引导用户继续对话。
输入框按钮
支持配置聊天输入框中展示的功能按钮,可选项包括上传图片与上传文档。其中,标准模式下默认仅支持选择上传文档按钮,在应用运行模型中设置多模态问答模型后,可支持选择上传图片按钮;Multi-Agent 模式下同时支持选择上传图片与上传文档按钮。
标准模式支持上传文档,在应用运行模型中设置多模态问答模型后,可支持选择上传图片按钮。
Multi-Agent模式支持上传文档和图片。
变量与记忆
变量
应用全局范围内可见的变量,包括系统变量、环境变量、API 参数和应用变量。详细介绍请参见 变量说明。单击设置可进入变量管理页面。 系统变量:应用运行时的变量。不支持用户自定义或修改现有变量。
环境变量:用于保存 API 密钥、用户密码等敏感信息。可自定义添加参数,单击新建,进入新建环境变量,支持填写默认值。
应用变量:可在应用全局范围内被“读取和修改”,在工作流之间、Agent 之间进行流转的全局变量。支持用户手动修改。
长期记忆
长期记忆支持在与用户对话中记忆信息,实现个性化的对话体验。开启长期记忆后,模型将在对话中抓取用户个性化信息并保存。详细介绍请参见 长期记忆说明。 记忆设置支持配置长期记忆的时效,可选范围为1~999天。默认为30天,超出时效的记忆内容将被删除。
记忆测试内容展示所有记忆时效范围内的记忆内容,支持对内容进行修改、删除和清空所有记忆内容的操作。
高级设置
同义词设置
可导入业务场景下的专有名词,对于 query 中的同义词,检索前将统一替换为知识库中知识的统一名称,提高检索的准确率。
意图达成优先级
在通常情况下,您无需设置意图达成优先级。
如您在平台设置的问答和工作流存在高度相似,可能会影响大模型对于调用方式的判断准确性,此时您可以设置合理优先级。
应用端用户权限
默认情况下,用户可查看全部知识。设置权限后,不同用户咨询时,仅可查看对应权限范围的知识。详细说明请参见 应用端用户权限说明。