tencent cloud

TDSQL-C MySQL 版

动态与公告
产品动态
产品公告
新手指引
产品简介
产品概述
产品优势
应用场景
产品架构
产品规格
实例类型
产品功能列表
数据库版本
地域和可用区
常用概念
使用限制
使用规范建议
自研内核
内核概述
内核版本更新动态
内核优化版本
功能类特性
性能类特性
安全类特性
稳定性特性
分析引擎特性
内核问题检查与修复
购买指南
计费概述
产品价格
创建集群
变配说明
续费说明
欠费说明
退费说明
按量转包年包月
按量转 Serverless
增值服务计费说明
查看费用账单
快速入门
数据库审计
简介
查看审计实例列表
开通审计服务
查看审计日志
日志投递
配置事后告警
修改审计规则
修改审计服务
关闭审计服务
审计规则模板
查看审计任务
授权子用户使用数据库审计
Serverless 服务
Serverless 简介
创建和管理 Serverless 版集群
弹性管理工具
Serverless 资源包
多可用区部署
配置变更
常见问题
Serverless 成本预估器
操作指南
操作总览
控制台切换集群页面视图
数据库连接
实例管理
配置变更
实例形态管理
集群管理
只读实例管理
数据库代理
账号管理
数据库管理
数据库管理工具(DMC)
参数配置
多可用区部署
全球数据库
备份与恢复
操作日志
迁移数据
并行查询
列存索引 CSI
分析引擎
数据库安全和加密
监控与告警
SQL 基本操作
使用 SCF 连接 TDSQL-C MySQL 版
标签
实践教程
TDSQL-C MySQL 版数据库审计等保实践
通过 DTS 升级数据库版本 MySQL5.7至8.0
TDSQL-C MySQL 版使用规范
新版本控制台
数据库代理多连接地址实现多 RO 组
数据库代理的优势
如何选择存储空间计费模式
通过 DTS 构建异地灾备
为集群创建 VPC
如何进行数据恢复
如何解决 CPU 使用率高的问题
如何授权子用户查看监控
白皮书
安全白皮书
性能白皮书
故障处理
连接相关
性能相关
API 文档
History
Introduction
API Category
Making API Requests
Instance APIs
Multi-Availability Zone APIs
Other APIs
Audit APIs
Database Proxy APIs
Backup and Recovery APIs
Parameter Management APIs
Billing APIs
serverless APIs
Resource Package APIs
Account APIs
Performance Analysis APIs
Data Types
Error Codes
常见问题
基础概念
购买与计费
兼容与格式
连接与网络
功能特性
控制台操作
数据库表
性能与日志
数据库审计
TDSQL-C MySQL 版和云数据库 MySQL 有什么区别
相关协议
服务等级协议
服务条款
TDSQL-C 政策
隐私政策
数据处理和安全协议
通用参考
标准与认证
词汇表
联系我们

监控告警最佳实践

PDF
聚焦模式
字号
最后更新时间: 2025-11-26 11:17:56
数据库的健康与性能直接关系到应用的稳定性和用户体验。一套完善的监控体系不仅能实时发现并解决潜在问题,还能提前预警风险,为系统优化和资源规划提供坚实的数据支撑。本文为您介绍只读分析引擎监控体系的构建方法,并详细解析需重点关注的性能、容量及同步类指标。

常用性能评价指标

指标一:分析引擎平均响应时间

平均响应时间是衡量引擎性能的核心指标,反映监控周期内所有 SQL 查询的平均执行时长。若该指标出现异常波动,通常源于以下场景:
新增高消耗 SQL 查询,拉长整体执行时间。
业务流量增长,QPS 上升导致处理延迟增加。
数据库系统自身出现异常。
监控建议​:
告警阈值可基于业务稳定运行期的历史最高执行时延设定(静态阈值),或根据实际延迟要求选择动态阈值(推荐中灵敏度,异常数据点 ≥ 2)。



指标二:分析引擎 QPS(每秒查询数)​​

QPS 直接体现业务请求的压力规模,是评估实例处理能力的关键指标。
​监控建议​:
提前评估对应实例规格的 QPS 承载能力,并以此为基准设置告警。
结合平均响应时间综合分析:QPS 上涨但响应时间稳定,说明当前负载可控;若两者同时上升,则可能需扩容或优化。

指标三:分析引擎 CPU 使用率​

分析引擎通常采用多线程并行执行模式,CPU 使用率天然偏高,因此不建议作为核心性能评价指标。
​监控建议​
可监控多节点实例场景下的节点 CPU 使用率,观察各节点是否负载均衡。
若 CPU 持续长时间高于90%(持续多个数据点),可能预示系统压力临近极限,需警惕慢查询与响应时间恶化。
若实例没有查询负载,但 CPU 较高,说明当前数据同步压力较大,大部分资源用于数据同步,需要考虑限流或者扩容。

指标四:分析引擎返回结果集大小​

该指标反映单次查询返回的数据量。过大的结果集可能导致客户端接收延迟甚至内存溢出(OOM)。
​监控建议​:
结果集异常增大时,需排查是否缺少分页机制或存在未优化的查询逻辑。

指标五:分析引擎内存使用率​

内存占用主要由 Block Cache(可配置)和运行时内存(Runtime Mem)组成。
监控建议​:
Block Cache 占用通常稳定,运行时内存突增表明 SQL 中间结果集过大,需优化查询或调整缓存策略。

容量评价指标

指标一:分析引擎存储使用率/量

磁盘空间为预分配制,使用率超过90%时将触发保护机制(禁止数据同步,仅允许读操作)。
监控建议​:
设置80%使用率为告警阈值,提前规划扩容,避免业务中断。

同步评价指标

指标一:分析引擎数据延迟时间

该指标用于监测行 - 列节点间的数据同步延迟,是保证数据实时一致性的关键。
监控建议​:
延迟异常需及时排查网络、负载或同步链路故障。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈