tencent cloud

腾讯云智能体开发平台

动态与公告
产品动态
产品公告
产品简介
产品概述
产品优势
应用场景
模型介绍
购买指南
套餐订阅
旧版计费
快速入门
智能体应用及其三种模式
基于“标准模式”创建“内容总结助手”
基于“单工作流模式”创建“网页内容抓取助手”
基于“Multi-Agent 模式”创建“脱口秀素材创作助手”
操作指南
应用开发
工作流
Multi-Agent
知识库
Widget
插件广场
模型列表
提示词模板
应用模板
平台管理
企业、工作空间与权限
API 文档
History
API Category
Making API Requests
Atomic Capability APIs
Operation Optimization APIs
Document Library APIs
Q&A Database APIs
Knowledge Tag APIs
Application Management APIs
Enterprise Management APIs
Billing APIs
Release Management APIs
Dialogue Endpoint APIs
Data Statistics APIs
Data Types
Error Codes
应用接口文档
对话接口总体概述
对话端接口文档(WebSocket)
对话端接口文档(HTTP SSE)
图片对话或文件对话(实时文档解析+对话)
离线文档上传
腾讯云智能体开发平台操作 cos 指南
ADP 文档解析协议
常见问题
产品常见问题
技术常见问题
相关协议
腾讯云智能体开发平台服务等级协议
腾讯云智能体开发平台服务特别条款
腾讯云智能体开发平台隐私政策
腾讯云智能体开发平台数据处理和安全协议
开源许可声明
联系我们
词汇表

智能结构化解析

PDF
聚焦模式
字号
最后更新时间: 2026-02-05 09:59:17
智能结构化解析是指通过使用结构化表改写模型,自动判断用户导入的表格文件是否为结构化形式。如当前您上传的表格源文件并非结构化表,也将通过模型自动判断,可能改写成结构化表,以提升表格问答准确率。

结构化表格和非结构化表格特征

1.结构化表格
核心特征:具有严格的二维关系模型,可直接对应关系型数据库结构。
数据特征:
行列严格对齐,每个单元格对应唯一行列坐标。
单级表头(单行且无合并单元格),列名具有唯一性和明确的语义。
无数据嵌套,每个单元格存储原子数据。
支持数据库导入导出,支持SQL查询。
2.非结构化表格
核心特征:以人类阅读优先的视觉呈现方式破坏了机器可读性
结构干扰特征:
合并单元格(跨行/跨列/多级合并)
动态列结构(如:列数随行位置变化)
分页重复表头(每页重复列名)

怎么将非结构化表改写成结构化表格?

说明:
在用户上传文档后,系统通过调用结构化表改写模型,自动判断用户导入的表格文件是否为结构化形式。您无需做任何额外操作。
结构化表改写模型,具备以下几个关键能力:
1. 行列表头识别:识别表格是列表头还是行表头;
2. 表名改写:将文件名-sheet名-内容中表名综合后给出新表名;
3. 说明信息提取:非主干表格中的说明、补充类信息进行提取,放置在说明字段;
4. 合并单元格拆解:将合并单元格进行拆解,还原行列对齐;
5. 单一表头改写:将多行/多列表头,改写单一表头形式。
通过模型智能改写后,可将非结构化表格智能转化为结构化表(但部分场景尚未支持)。
结构化表格文件上传后,您可以在文档列表中的对应文件右侧单击更多 > 解析切分干预,进入二级页面后,查看结构化显示。

如您认为当前模型转写的结构化显示有误,可重新编辑原表格上传;或者针对该表格关闭「表格检索增强」开关,则该表格将不被用于SQL查询,但不影响该表格的语义切片召回。



对于结构化表格文件,您可以点击「表头高级设置」,对表格添加描述、或者自定义表头释义,以提升表格检索和问答准确率。



如您希望返回编辑表格解析拆分之后的 markdown 结果,可以点击切换到语义切片显示。




结构化表格的检索方式会有不同吗?

当您在应用配置-知识库高级设置中,开启「Excel检索增强」开关后,将支持SQL方式查询结构化表格,提升用户基于自然语言对该类文件的的查询和计算准确率。





有哪些非结构化表格,无法写成结构化表格?

明确多个重复表头,不能转化成数据库表。



行值有多行统计信息类表格,不能改写。



有额外行列存在冗余信息的,不可改写。




帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈