tencent cloud

腾讯云可观测平台

动态与公告
产品动态
产品简介
产品概述
产品优势
基本功能
基本概念
应用场景
使用限制
购买指南
云产品监控
应用性能监控
终端性能监控
前端性能监控
云拨测
Prometheus 监控服务
Grafana 服务
事件总线
云压测
快速入门
监控概览
实例分组
云产品监控
应用性能监控
云拨测
云压测
Prometheus 监控服务
Grafana 服务
创建 Dashboard
事件总线
告警服务
云产品监控
云产品监控指标
控制台操作指南
云服务器监控组件
云产品监控对接 Grafana
故障处理
实践教程
应用性能监控
应用性能监控简介
接入指南
控制台操作指南
实践教程
参考信息
常见问题
终端性能监控
终端性能监控概述
控制台操作指南
接入指南
实践教程
前端性能监控
前端性能监控简介
控制台操作指南
接入指南
常见问题
云拨测
产品简介
控制台操作指南
常见问题
云压测
云压测概述
控制台操作指南
实践教程
JavaScript API 列表
常见问题
Prometheus 监控
Prometheus 监控简介
接入指南
控制台操作指南
实践教程
Terraform
常见问题
Grafana 服务
产品简介
控制台操作指南
Grafana 平台常用功能指引
常见问题
Dashboard
什么是 Dashboard
控制台操作指南
告警管理
控制台操作指南
故障处理
常见问题
事件总线
事件总线简介
控制台操作指南
实践教程
常见问题
报表管理
常见问题
腾讯云可观测平台常见问题
告警服务相关
一般性问题
监控图表相关
云服务器监控组件相关
动态阈值告警相关
云监控对接 Grafana 相关
文档阅读指南
相关协议
应用性能监控服务等级协议
APM 隐私协议
APM 数据处理和安全协议
前端性能监控服务等级协议
终端性能监控服务等级协议
云拨测服务等级协议
Prometheus 监控服务服务等级协议
Grafana 服务服务等级协议
云压测服务等级协议
云压测使用限制
Cloud Monitor Service Level Agreement
词汇表

容器服务 TKE 监控实践

PDF
聚焦模式
字号
最后更新时间: 2024-01-27 17:51:37

新版 TKE 监控特性

● 支持自动更新监控对象。 ● 新增 Workload/Component/Node 监控场景。 ● 更多的监控指标监控,新版 TKE 指标总数可达140个。 ● 可针对某个监控维度屏蔽特殊对象(例如频繁告警的 Pod)。

操作步骤

下列以“容器监控-pod”维度为例,介绍如何实现 自动更新 Dashboard 监控对象自动更新告警监控对象屏蔽频繁告警监控对象

自动更新 Dashboard 监控对象

2. 选择【Dashboard】>【Dashboard 列表】>【新建 Dashboard】>【新建图表】。
3. 参考下列步骤配置监控图表。
监控类型:选择云产品监控。
指标:选择云产品为“容器服务(新)-pod”,选择指标为“CPU利用率(%)”。
筛选:可以通过维度筛选绑定图表对象(地域、集群、命名空间、工作负载等)。
地域:选择监控对象所在的地域
集群:选择监控对象所在的集群。
筛选条件:需要创建两个筛选条件,一个为命名空间;另一个为工作负载均衡类型,监控指定 Workload 下的所有 Pod,并在 Pods 发生频繁新增/更新时进行自动更新 Dashboard 监控对象。如下图所示:


4. 配置完后在页面右上方单击【保存】,即可保存图表。

自动更新告警监控对象

2. 选择【告警配置】>【告警策略】>【新建】,进入新建告警策略页。
3. 选择策略类型为 “容器服务(新)-pod”,并参考下列步骤配置告警对象。
地域:选择监控对象所在的地域
集群:选择监控对象所在的集群。
筛选条件:需要创建两个筛选条件,一个为命名空间;另一个为工作负载均衡类型,监控指定 Workload 下的所有 Pod,并在 Pods 发生频繁新增/更新时进行自动更新告警监控对象。如下图:


说明:
如需了解更多告警配置请参见 新建告警策略

屏蔽频繁告警监控对象

当 Pod 频繁触发告警,您可以参考以下说明屏蔽 Node下部分或所有 Pods 监控告警对象。
如下图,可通过配置 Pod 名称 “!=”操作符进行部分 Pod 告警屏蔽。



帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈