tencent cloud

Elasticsearch Service

新手指引
动态与公告
产品动态
产品公告
安全公告
产品简介
产品概述
Elasticsearch 版本支持说明
产品功能
高级特性(X-Pack)
产品优势
应用场景
能力与限制说明
相关概念
购买指南
计费概述
产品定价
ES Serverless 服务定价
欠费说明
ES 内核增强
内核版本发布记录
定向路由优化
压缩算法优化
FST Off Heap 内存优化
快速入门
集群规格和容量配置评估
创建集群
访问集群
ES Serverless 服务指南
服务概述
基本概念
5分钟快速体验
快速使用
访问控制
数据写入
数据查询
索引管理
告警管理
ES API 参考
相关问题
数据应用指南
数据应用概述
数据管理
ES 集群指南
集群管理
访问控制
集群多可用区部署
集群扩缩容
集群配置
插件配置
监控与告警
日志查询
数据备份
升级
实践教程
数据迁移和同步
应用场景构建
索引设置
SQL 支持
企业微信机器人接收 Watcher 告警
API 文档
History
Introduction
API Category
Instance APIs
Making API Requests
Data Types
Error Codes
常见问题
产品相关问题
ES 集群
词汇表
新版介绍
Elasticsearch Service 2020.07新版
Elasticsearch Service 2020.2新版
Elasticsearch Service 2019.12新版

监控告警配置建议

PDF
聚焦模式
字号
最后更新时间: 2020-08-21 17:38:02
腾讯云 ES 不仅为运行中的 ES 集群提供了多项监控指标,用于监测集群的运行情况,还提供了一些关键指标的配置告警功能,帮助您及时发现集群问题并进行处理。具体使用方法参考 查看监控配置告警。 本文为您介绍在使用 ES 集群过程中需要重点关注的一些指标及其告警建议配置:
指标
告警建议配置
详细说明
集群健康状态
统计周期1分钟,>=1,持续5个周期,每30分钟告警一次
集群健康状态取值为:
0:绿色,表示集群所有主分片和副本分片都可用,集群处于最健康的状态。
1:黄色,表示所有的主分片均可用,但存在不可用副本分片。此时,搜索结果仍然是完整的,但集群的高可用性在一定程度上受到影响,数据面临较高的丢失风险。
2:红色,表示至少一个主分片以及它的全部副本分片均不可用。集群处于红色状态意味着已有部分数据不可用,搜索只能返回部分数据,而分配到丢失分片上的请求会返回异常。
集群健康状态是集群当前运行情况的最直接体现,当集群处于黄色或红色状态时,应立即排查产生原因,并及时修复,防止数据丢失和服务不可用。
平均磁盘使用率
统计周期1分钟,>80%,持续5个周期,每30分钟告警一次
平均磁盘使用率表示集群各节点磁盘使用率的平均值。磁盘使用率过高会导致节点没有足够的磁盘空间容纳分配到该节点上的分片,从而导致创建索引,添加文档等基本操作执行失败。建议在平均磁盘使用率超过75%时及时清理数据或扩容集群。
平均 JVM 内存使用率
统计周期1分钟,>85%,持续5个周期,每30分钟告警一次
平均 JVM 内存使用率表示集群各节点 JVM 内存使用率的平均值。JVM 内存使用率过高会导致读写操作被拒绝,集群 GC 频繁,甚至出现 OOM 等问题。当发现 JVM 内存使用率超过阈值时,建议通过纵向扩容的方式提高集群节点的规格。
平均 CPU 使用率
统计周期1分钟,>90%,持续5个周期,每30分钟告警一次
平均 CPU 使用率表示集群各节点 CPU 使用率的平均值。该值过高会导致集群节点处理能力下降,甚至宕机。发现 CPU 过高时,应根据集群当前节点配置情况和业务情况,提高节点规格或降低业务请求量。
bulk 拒绝率
统计周期1分钟,>0%,持续1个周期, 每30分钟告警一次
bulk 拒绝率表示单周期内集群执行 bulk 操作被拒绝次数占 bulk 总操作次数的百分比。当 bulk 拒绝率大于0%,即出现 bulk 拒绝时,说明集群已经达到了 bulk 操作处理能力的上限,或集群出现异常,应及时排除出现 bulk 拒绝的原因并及时解决,否则会影响业务的 bulk 操作,甚至出现数据丢失情况。
查询拒绝率
统计周期1分钟,>0%,持续1个周期,每30分钟告警一次
查询拒绝率表示单周期内集群执行查询操作被拒绝次数占查询总操作数的百分比。当查询拒绝率大于0%,即出现查询拒绝时,说明集群已经达到了查询操作处理能力的上限,或集群出现异常,应及时排查出现查询拒绝的原因并及时解决,否则会影响业务的查询操作。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈