产品动态

产品简介

产品概述

应用场景

产品架构

实例类型

兼容性说明

使用规范建议

自研内核

内核概述

内核版本更新动态

功能类特性

性能类特性

产品计费

计费概述

购买方式

价格详情

续费说明

欠费说明

退费说明

快速入门

创建实例

连接实例

用户指南

数据迁移

数据同步/订阅

实例管理

参数配置

账号管理

安全组

备份与恢复

数据库审计

标签管理

实践教程

Online DDL 的技术演进与使用实践

锁机制解析与问题排查实践

数据智能调度及相关性能优化实践

TDSQL Boundless 选型指南与实践教程

开发指南

开发指南（MySQL 兼容模式）

开发指南（HBase 兼容模式）

性能调优

性能调优概述

SQL 调优

DDL 调优

性能白皮书

性能概述

TPC-C 测试

Sysbench 测试

API 文档

History

Introduction

API Category

Making API Requests

Instance APIs

Security Group APIs

Task APIs

Backup APIs

Rollback APIs

Parameter APIs

Database APIs

Data Types

Error Codes

通用参考

系统原理

SQL 参考

数据库参数说明

TPC-H 基准测试数据模型参考

错误码信息

安全与合规

常见问题

服务协议

服务等级协议

服务条款

隐私政策

数据处理和安全协议

联系我们

词汇表

如何存储一张表的数据

PDF

聚焦模式

字号

最后更新时间： 2026-02-10 10:59:29

KV 编码和数据空间
在 TDSQL Boundless 中，所有数据都编码为 Key-Value 形式。编码后的 Key 具有 mem-comparable 特性（内存可比较）。
编码规则：系统为每个索引分配一个全局递增的唯一 ID。例如，表 t1 的主键和二级索引各有自己的 ID。同一索引的所有数据，其编码后的 Key 拥有相同的前缀（如 t1 主键的前缀是00002711），因此它们在逻辑上是连续的。
数据空间：数据可以被视为分布在一条无限长的数轴上，每个 Key 占据一个唯一位置。拥有相同前缀的索引数据会集中分布在这条线上的一个连续区间内。这样的一个数据区间称为一个 Region。
因此，同一索引的数据在空间上是连续的，但同一张表的不同索引可能分布在不同的、不连续的 Region 中。
﻿
数据分片和复制组
在逻辑数据空间中，每个 Key 对应一个离散的点，但物理上每个 Key-Value 都需要存储空间。当数据量增大时，单个节点无法承载所有数据，因此数据被分割成多个分片，称为 Region。每个 Region 的容量标准为256MB或10万行数据。由于不同索引的数据量不同，Region 的数量会有所差异。
如下所示，表 t1 行数不足10万行，但 Value 字段较多，主键记录占空间更大，因此主键需要2个 Region，二级索引只需1个 Region。
表 t2 行数很多（如20万行），每一行的数据 Key-Value 很短，其主键和二级索引各自需要2个 Region，分别容纳10万行。
为了优化数据调度，在 Region 之上引入了 Replication Group（复制组）。例如，t1.pk 和 t1.idxb 属于不同 Region，但通过复制组可以将这些 Region 调度到相同节点上，从而在 INSERT 操作时避免 2PC 分布式事务，并在查询时避免跨节点回表。一个复制组可包含多个 Region，且复制组的 Leader 节点即为组内所有 Region 的 Leader 节点。 
﻿

帮助和支持

本页内容是否解决了您的问题？

您也可以联系销售或提交工单以寻求帮助。

填写满意度调查问卷，共创更好文档体验。

文档反馈

tencent cloud

TDSQL Boundless

如何存储一张表的数据

KV 编码和数据空间

数据分片和复制组

帮助和支持