tencent cloud

弹性 MapReduce

动态与公告
产品动态
产品公告
安全公告
产品简介
产品概述
产品优势
产品架构
产品功能
应用场景
约束与限制
技术支持范围
产品发行版
购买指南
EMR on CVM 计费说明
EMR on TKE 计费说明
EMR Serverless HBase 计费说明
快速入门
EMR on CVM 快速入门
EMR on TKE 快速入门
EMR on CVM 操作指南
规划集群
管理权限
配置集群
管理集群
管理服务
监控告警
智能管家
EMR on TKE 操作指南
EMR on TKE 简介
配置集群
管理集群
管理服务
监控运维
应用分析
EMR Serverless HBase 操作指南
EMR Serverless HBase 产品简介
配额与限制
规划实例
管理实例
监控告警
开发指南
EMR 开发指南
Hadoop开发指南
Spark 开发指南
HBASE开发指南
Phoenix on Hbase 开发指南
Hive 开发指南
Presto开发指南
Sqoop 开发指南
Hue 开发指南
Oozie 开发指南
Flume 开发指南
Kerberos 开发指南
Knox 开发指南
Alluxio 开发指南
Kylin 开发指南
Livy 开发指南
Kyuubi 开发指南
Zeppelin 开发指南
Hudi 开发指南
Superset 开发指南
Impala 开发指南
Druid 开发指南
Tensorflow 开发指南
Kudu 开发指南
Ranger 开发指南
Kafka 开发指南
Iceberg 开发指南
StarRocks 开发指南
Flink 开发指南
JupyterLab 开发指南
MLflow 开发指南
实践教程
EMR on CVM 运维实践
数据迁移实践
自定义伸缩实践教程
API 文档
History
Introduction
API Category
Cluster Resource Management APIs
Cluster Services APIs
User Management APIs
Data Inquiry APIs
Scaling APIs
Configuration APIs
Other APIs
Serverless HBase APIs
YARN Resource Scheduling APIs
Making API Requests
Data Types
Error Codes
常见问题
EMR on CVM常见问题
服务等级协议
联系我们

告警迁移公告

PDF
聚焦模式
字号
最后更新时间: 2022-11-25 16:06:46

背景

弹性 MapReduce 产品于2019年9月10日对主机以及组件服务监控项进行了升级,新增了“弹性 MapReduce”策略类型,覆盖了数百监控项指标,您可以在腾讯云可观测平台弹性 MapReduce策略类型下配置告警策略。原“EMR”策略类型将于2021年03月30日23:00下线,已配置的“EMR”策略类型将全部失效。后续新增告警策略,请配置在“弹性 MapReduce”策略类型下。
“EMR”与“弹性 MapReduce”策略类型对比:
策略类型
指标覆盖
支持与维护
EMR
集群告警(12个指标)
子机告警(8个指标)
将于2021年04月09日23:00下线,且不在维护
弹性 MapReduce
主机监控
服务监控
集群监控
已于2019年09月10日上线,持续维护
注意
“弹性 MapReduce”策略类型已覆盖原有 EMR 策略所有指标,详情可参考 新老指标对照表

告警策略迁移说明

在“EMR”策略类型下线时,系统会自动将原有的“EMR”策略类型的告警策略后台迁移至新的“弹性 MapReduce”策略类型下,具体规则和验证方法见后续通知。
注意
不排除极个别用户存在需要手动迁移的特殊情况。
手动迁移具体步骤如下:
1. 梳理已有告警指标以及告警策略 登录 腾讯云可观测平台控制台,选择左侧菜单栏【告警管理】>【告警配置】>【告警策略】中,单击【高级筛选】,在弹出页面中按【策略类型】选择“EMR”策略类型对应的告警策略类型,查询对应类别下的告警策略,并下载原“EMR”策略类型下已配置的告警策略。


2. 配置新告警策略 在集群列表中单击【告警配置】,跳转至【告警策略】页面后,单击【新建】,在策略类型中选择“弹性 MapReduce”,根据第1步梳理下载的策略进行告警配置,告警配置方法可参考 配置告警
3. 验证新的告警策略 验证“弹性 MapReduce”告警策略是否启用并能成功触发告警。在【指标告警】设置一个最小触发阈值,选择设定【接收组或接收人】,以及选择接受渠道(邮件、短信、微信),达到测试验证效果。例如内存区域占比_SO,统计周期五分钟,当阈值大于等于1%,持续1周期即触发告警,每五分钟告警一次。
4. 清理旧告警策略 新策略类型验证完成后删除原“EMR”策略类型下配置的告警策略。在告警策略筛选条件中按【策略类型】选择“EMR”策略类型对应的告警策略进行查询,对照步骤1中下载策略表,进行删除。
如果您在迁移中遇到问题,请及时 联系我们进行处理。

新老指标对照表

原有策略类型
指标/事件告警
原有指标/事件告警名称
新策略类型
新指标/事件名称
EMR-集群告警
指标告警
HDFS 已用存储空间
弹性 MapReduce-HDFS-概览
集群存储容量_CapacityUsed
指标告警
HDFS 存储利用率
弹性 MapReduce-HDFS-概览
HDFS 存储空间使用率_capacityused
指标告警
YARN 应用阻塞数
弹性 MapReduce-YARN-概览
Applications_pending
指标告警
YARN 应用失败数
弹性 MapReduce-YARN-概览
Applications_failed
指标告警
集群 CPU 已分配核数
弹性 MapReduce-YARN-概览
Cores_allocatedVirtualCores
指标告警
集群 CPU 利用率
弹性 MapReduce-YARN-概览
CPU 使用率_usageRatio
指标告警
集群内存可用空间
弹性 MapReduce-YARN-概览
Memory_availableMB
指标告警
集群内存利用率
弹性 MapReduce-YARN-概览
内存使用率_usageRatio
指标告警
集群容器阻塞数
弹性 MapReduce-YARN-概览
Containers_containersPending
指标告警
Hbase 请求量
弹性 MapReduce-HBASE-概览
集群总请求数量_clusterRequests
指标告警
Hbase 同步耗时
不在维护
-
指标告警
Hbase 同步 log 长度
不在维护
-
事件告警
节点监控心跳丢失
弹性 MapReduce-主机监控-网络
节点监控心跳丢失
事件告警
进程重启
弹性 MapReduce-主机监控-进程
进程 OOM
EMR-子机告警
指标告警
磁盘利用率
弹性 MapReduce-主机监控-磁盘
磁盘空间使用率_used_all
指标告警
内存使用量
弹性 MapReduce-主机监控-内存
内存使用情况_MemFree
指标告警
机器重启
不在维护
机器重启
指标告警
内存利用率
弹性 MapReduce-主机监控-内存
内存使用占比_used_percent
指标告警
CPU 利用率
弹性 MapReduce-主机监控-CPU
CPU 使用率_idle
指标告警
内网入包量
不在维护
-
指标告警
内网出包量
不在维护
-
指标告警
TCP 连接数
弹性 MapReduce-主机监控-网络
TCP 连接数


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈