tencent cloud

容器服务 TKE 监控实践
最后更新时间:2024-01-27 17:51:37
容器服务 TKE 监控实践
最后更新时间: 2024-01-27 17:51:37

新版 TKE 监控特性

● 支持自动更新监控对象。 ● 新增 Workload/Component/Node 监控场景。 ● 更多的监控指标监控,新版 TKE 指标总数可达140个。 ● 可针对某个监控维度屏蔽特殊对象(例如频繁告警的 Pod)。

操作步骤

下列以“容器监控-pod”维度为例,介绍如何实现 自动更新 Dashboard 监控对象自动更新告警监控对象屏蔽频繁告警监控对象

自动更新 Dashboard 监控对象

2. 选择【Dashboard】>【Dashboard 列表】>【新建 Dashboard】>【新建图表】。
3. 参考下列步骤配置监控图表。
监控类型:选择云产品监控。
指标:选择云产品为“容器服务(新)-pod”,选择指标为“CPU利用率(%)”。
筛选:可以通过维度筛选绑定图表对象(地域、集群、命名空间、工作负载等)。
地域:选择监控对象所在的地域
集群:选择监控对象所在的集群。
筛选条件:需要创建两个筛选条件,一个为命名空间;另一个为工作负载均衡类型,监控指定 Workload 下的所有 Pod,并在 Pods 发生频繁新增/更新时进行自动更新 Dashboard 监控对象。如下图所示:


4. 配置完后在页面右上方单击【保存】,即可保存图表。

自动更新告警监控对象

2. 选择【告警配置】>【告警策略】>【新建】,进入新建告警策略页。
3. 选择策略类型为 “容器服务(新)-pod”,并参考下列步骤配置告警对象。
地域:选择监控对象所在的地域
集群:选择监控对象所在的集群。
筛选条件:需要创建两个筛选条件,一个为命名空间;另一个为工作负载均衡类型,监控指定 Workload 下的所有 Pod,并在 Pods 发生频繁新增/更新时进行自动更新告警监控对象。如下图:


说明:
如需了解更多告警配置请参见 新建告警策略

屏蔽频繁告警监控对象

当 Pod 频繁触发告警,您可以参考以下说明屏蔽 Node下部分或所有 Pods 监控告警对象。
如下图,可通过配置 Pod 名称 “!=”操作符进行部分 Pod 告警屏蔽。


本页内容是否解决了您的问题?
您也可以 联系销售 提交工单 以寻求帮助。

文档反馈