tencent cloud

TDSQL Boundless

产品动态
产品简介
产品概述
应用场景
产品架构
实例类型
兼容性说明
使用规范建议
自研内核
内核概述
内核版本更新动态
功能类特性
性能类特性
产品计费
计费概述
购买方式
价格详情
续费说明
欠费说明
退费说明
快速入门
创建实例
连接实例
用户指南
数据迁移
数据同步/订阅
实例管理
参数配置
账号管理
安全组
备份与恢复
数据库审计
标签管理
实践教程
Online DDL 的技术演进与使用实践
锁机制解析与问题排查实践
数据智能调度及相关性能优化实践
TDSQL Boundless 选型指南与实践教程
开发指南
开发指南(MySQL 兼容模式)
开发指南(HBase 兼容模式)
性能调优
性能调优概述
SQL 调优
DDL 调优
性能白皮书
性能概述
TPC-C 测试
Sysbench 测试
API 文档
History
Introduction
API Category
Making API Requests
Instance APIs
Security Group APIs
Task APIs
Backup APIs
Rollback APIs
Parameter APIs
Database APIs
Data Types
Error Codes
通用参考
系统原理
SQL 参考
数据库参数说明
TPC-H 基准测试数据模型参考
错误码信息
安全与合规
常见问题
服务协议
服务等级协议
服务条款
隐私政策
数据处理和安全协议
联系我们
词汇表

如何存储一张表的数据

PDF
聚焦模式
字号
最后更新时间: 2026-02-10 10:59:29

KV 编码和数据空间

在 TDSQL Boundless 中,所有数据都编码为 Key-Value 形式。编码后的 Key 具有 mem-comparable 特性(内存可比较)。
编码规则:系统为每个索引分配一个全局递增的唯一 ID。例如,表 t1 的主键和二级索引各有自己的 ID。同一索引的所有数据,其编码后的 Key 拥有相同的前缀(如 t1 主键的前缀是00002711),因此它们在逻辑上是连续的。
数据空间:数据可以被视为分布在一条无限长的数轴上,每个 Key 占据一个唯一位置。拥有相同前缀的索引数据会集中分布在这条线上的一个连续区间内。这样的一个数据区间称为一个 Region。
因此,同一索引的数据在空间上是连续的,但同一张表的不同索引可能分布在不同的、不连续的 Region 中。


数据分片和复制组

在逻辑数据空间中,每个 Key 对应一个离散的点,但物理上每个 Key-Value 都需要存储空间。当数据量增大时,单个节点无法承载所有数据,因此数据被分割成多个分片,称为 Region。每个 Region 的容量标准为256MB或10万行数据。由于不同索引的数据量不同,Region 的数量会有所差异。
如下所示,表 t1 行数不足10万行,但 Value 字段较多,主键记录占空间更大,因此主键需要2个 Region,二级索引只需1个 Region。
表 t2 行数很多(如20万行),每一行的数据 Key-Value 很短,其主键和二级索引各自需要2个 Region,分别容纳10万行。
为了优化数据调度,在 Region 之上引入了 Replication Group(复制组)。例如,t1.pk 和 t1.idxb 属于不同 Region,但通过复制组可以将这些 Region 调度到相同节点上,从而在 INSERT 操作时避免 2PC 分布式事务,并在查询时避免跨节点回表。一个复制组可包含多个 Region,且复制组的 Leader 节点即为组内所有 Region 的 Leader 节点。


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈