tencent cloud

智能结构化解析
最后更新时间:2025-08-12 16:26:13
智能结构化解析
最后更新时间: 2025-08-12 16:26:13
智能结构化解析是指通过使用结构化表改写模型,自动判断用户导入的表格文件是否为结构化形式。如当前您上传的表格源文件并非结构化表,也将通过模型自动判断,可能改写成结构化表,以提升表格问答准确率。

结构化表格和非结构化表格特征

1.结构化表格
核心特征:具有严格的二维关系模型,可直接对应关系型数据库结构。
数据特征:
行列严格对齐,每个单元格对应唯一行列坐标。
单级表头(单行且无合并单元格),列名具有唯一性和明确的语义。
无数据嵌套,每个单元格存储原子数据。
支持数据库导入导出,支持SQL查询。
2.非结构化表格
核心特征:以人类阅读优先的视觉呈现方式破坏了机器可读性
结构干扰特征:
合并单元格(跨行/跨列/多级合并)
动态列结构(如:列数随行位置变化)
分页重复表头(每页重复列名)

怎么将非结构化表改写成结构化表格?

说明:
在用户上传文档后,系统通过调用结构化表改写模型,自动判断用户导入的表格文件是否为结构化形式。您无需做任何额外操作。
结构化表改写模型,具备以下几个关键能力:
1. 行列表头识别:识别表格是列表头还是行表头;
2. 表名改写:将文件名-sheet名-内容中表名综合后给出新表名;
3. 说明信息提取:非主干表格中的说明、补充类信息进行提取,放置在说明字段;
4. 合并单元格拆解:将合并单元格进行拆解,还原行列对齐;
5. 单一表头改写:将多行/多列表头,改写单一表头形式。
通过模型智能改写后,可将非结构化表格智能转化为结构化表(但部分场景尚未支持)。
结构化表格文件上传后,您可以在文档列表点击解析切分干预,进入二级页面后,查看结构化显示。



如您认为当前模型转写的结构化显示有误,可重新编辑原表格上传;或者针对该表格关闭「表格检索增强」开关,则该表格将不被用于SQL查询,但不影响该表格的语义切片召回。



对于结构化表格文件,您可以点击「表头高级设置」,对表格添加描述、或者自定义表头释义,以提升表格检索和问答准确率。



如您希望返回编辑表格解析拆分之后的 markdown 结果,可以点击切换到语义切片显示。




结构化表格的检索方式会有不同吗?

当您在应用配置-知识库高级设置中,开启「表格检索增强」开关后,将支持SQL方式查询结构化表格,提升用户基于自然语言对该类文件的的查询和计算准确率。如该开关关闭,则默认使用「语义检索」或「混合检索」策略,检索语义切片,来完成表格问答。



本页内容是否解决了您的问题?
您也可以 联系销售 提交工单 以寻求帮助。

文档反馈