tencent cloud

TDSQL-C MySQL 版

动态与公告
产品动态
产品公告
新手指引
产品简介
产品概述
产品优势
应用场景
产品架构
产品规格
实例类型
产品功能列表
数据库版本
地域和可用区
常用概念
使用限制
使用规范建议
自研内核
内核概述
内核版本更新动态
内核优化版本
功能类特性
性能类特性
安全类特性
稳定性特性
分析引擎特性
内核问题检查与修复
购买指南
计费概述
产品价格
创建集群
变配说明
续费说明
欠费说明
退费说明
按量转包年包月
按量转 Serverless
增值服务计费说明
查看费用账单
快速入门
数据库审计
简介
查看审计实例列表
开通审计服务
查看审计日志
日志投递
配置事后告警
修改审计规则
修改审计服务
关闭审计服务
审计规则模板
查看审计任务
授权子用户使用数据库审计
Serverless 服务
Serverless 简介
创建和管理 Serverless 版集群
弹性管理工具
Serverless 资源包
多可用区部署
配置变更
常见问题
Serverless 成本预估器
操作指南
操作总览
控制台切换集群页面视图
数据库连接
实例管理
配置变更
实例形态管理
集群管理
只读实例管理
数据库代理
账号管理
数据库管理
数据库管理工具(DMC)
参数配置
多可用区部署
全球数据库
备份与恢复
操作日志
迁移数据
并行查询
列存索引 CSI
分析引擎
数据库安全和加密
监控与告警
SQL 基本操作
使用 SCF 连接 TDSQL-C MySQL 版
标签
实践教程
TDSQL-C MySQL 版数据库审计等保实践
通过 DTS 升级数据库版本 MySQL5.7至8.0
TDSQL-C MySQL 版使用规范
新版本控制台
数据库代理多连接地址实现多 RO 组
数据库代理的优势
如何选择存储空间计费模式
通过 DTS 构建异地灾备
为集群创建 VPC
如何进行数据恢复
如何解决 CPU 使用率高的问题
如何授权子用户查看监控
白皮书
安全白皮书
性能白皮书
故障处理
连接相关
性能相关
API 文档
History
Introduction
API Category
Making API Requests
Instance APIs
Multi-Availability Zone APIs
Other APIs
Audit APIs
Database Proxy APIs
Backup and Recovery APIs
Parameter Management APIs
Billing APIs
serverless APIs
Resource Package APIs
Account APIs
Performance Analysis APIs
Data Types
Error Codes
常见问题
基础概念
购买与计费
兼容与格式
连接与网络
功能特性
控制台操作
数据库表
性能与日志
数据库审计
TDSQL-C MySQL 版和云数据库 MySQL 有什么区别
相关协议
服务等级协议
服务条款
TDSQL-C 政策
隐私政策
数据处理和安全协议
通用参考
标准与认证
词汇表
联系我们

LibraDB 引擎功能特性

PDF
聚焦模式
字号
最后更新时间: 2024-12-13 16:08:42

功能介绍

LibraDB 引擎主要服务于高效的分析类查询。是一个为客户提供实时且高性能的复杂 SQL 处理的扩展只读分析组件。利用 LibraDB 引擎的列式存储能力、向量化并行执行引擎以及分布式并行执行而扩展的优化器,可以让客户能够很简单的在数据库中原地体验到高效地分析能力,另外 LibraDB 的列式存储为高 QPS 的变更、事务的 ACID,进行了针对性的优化,保证了查询数据的实时性以及一致性。

支持版本

LibraDB 引擎内核版本1.2404.7及以上。

原理

LibraDB 引擎内核实现主要分为3个部分,分别为数据同步组件、计算引擎与列式存储。其中数据同步组件主要负责将行存数据转换加载为列式存储的形式。主要实现原理为 binlog 同步与消费,与 MySQL 中的主从复制机制一样;计算引擎主要负责元数据存储、执行计划生成以及执行算子生成等相关工作;列式存储主要负责数据存储,算子执行等相关工作。

支持的功能

LibraDB 引擎内核功能支持多种优异特性,下文为您简单介绍一下产品支持的功能。

一、大规模并行计算 MPP

MPP(Massively Parallel Processing)架构是一种分布式数据处理技术,能够通过将工作负载分散到多个节点上来提高数据处理性能。在 LibraDB 引擎中,在扩展支持了多副本能力后,可以将多个只读分析引擎实例的节点组合成集群,每个节点拥有独立的磁盘和内存系统,然后通过专用网络或商业通用网络连接彼此、协同计算,从而提供整体数据处理服务。可以有效的扩展在超大数据规模下的数据处理性能,避免受制于单一节点的性能瓶颈,以支撑不同量级的用户需求。
MPP 能力的优点在于高性能的数据处理,可以充分利用多个节点的计算资源,在执行同一个 SQL 时,可将 SQL 算子分发到多个节点中共同执行。同时可以支持横向的扩展,针对用户的业务增长,也支持性能的扩容。

二、向量化执行引擎

针对 LibraDB 引擎而言,数据不仅仅按列存储,还会基于列进行计算。在 TXSQL 这种传统的 OLTP 引擎中,通常会基于行存储进行计算,主要原因是事务以点查、点读、点写为主。但是在分析作为主要场景的 LibraDB 引擎中,单 SQL 的计算量可能极大。所以在 LibraDB 引擎中,我们实现了向量化的执行模式,在对内存中的列式数据,一个 batch 调用一次 SIMD 指令,减少了函数的调用次数,降低了 cache miss。同时还可以充分利用 SIMD 指令的并行能力,缩短计算耗时。

三、支持高速变更场景下的列式存储

在 TDSQL-C MySQL 版的读写实例中,可以支撑超百万级别的数据在线操作 QPS。而作为一个可以支撑实时数据分析的 LibraDB 引擎,必须要能够满足在如此之高的数据变更场景下的数据一致性。传统的列式存储在数据的大批量写入具有一定的优势,但是在面对大规模数据的 delete 和 update 就显得性能不足。在传统的实时数仓场景下,好的实践就是将 update 变更为 delete 和 insert,同时在数据同步层去实现数据的批量执行能力。但是列式存储在 delete 场景下依然存在一些性能劣势。综合以上的情况,传统列式的存储必定会存在较高的数据延时,无法达到实时数据分析的效果。
LibraDB 引擎通过在存储层的优化和支持,可以满足用户在高并发场景下的数据变更的数据一致性,避免因为读写实例的数据频繁变更带来的数据延时而错过分析时间。

四、指定数据加载能力

针对 TDSQL-C MySQL 版中的数据而言,并非所有的数据都具备数据分析价值,所以不需要所有的对象都加载为列存。故 libraDB 引擎支持指定对象加载的能力。可在数据加载的控制台设置或者通过命令行 SQL 指定需要加载的 LibraDB 的对象。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈