使用场景
腾讯云容器服务 TKE 是一种托管的 Kubernetes 服务,TKE 自动管理 Kubernetes 控制平面节点的可用性和可扩展性,这些节点负责调度容器、管理应用程序可用性、存储集群数据和其他关键任务。但某些工作负载行为或配置可能会增加控制平面的负载,从而导致性能下降。在这些情况下,访问关键控制面指标和监控图表使集群管理员能够快速检测和排除集群上运行的工作负载的问题。例如,资源不足的工作节点可能会妨碍调度程序调度新 Pod 的能力。为了及时检测这些新出现的调度问题,集群管理员需要访问调度程序指标以查看待处理的 Pod 并及时收到通知。此外,控制面指标数量庞大,即使是经验丰富的管理员也面临选择最佳监控指标和创建有效监控图表的挑战。 TKE 提供了集群控制面组件的监控能力,使集群管理员能够查看 Kubernetes 集群控制面的性能,快速检测、排除故障并修复问题。TKE 集群通过 Prometheus 监控提供监控图表。
前提条件
已开通 Prometheus 监控服务并关联实例。
操作步骤
2. 在集群管理页面,单击目标集群ID,进入集群详情页。
3. 选择左侧导航中的 Prometheus 监控。
4. 可通过一键开通 Prometheus 监控、关联已有 Prometheus 实例开启 Prometheus 监控。
5. 在 Prometheus 监控页面中,单击监控详情,单击核心组件监控。
在该页面,您可以查看 API Server、Kube Scheduler、Controller Manager 监控大盘。
相关文档