动态与公告
- 产品动态
- 公告
- 产品发布记录
产品简介
购买指南
- 购买指引
- 购买 TKE 标准集群
- 购买原生节点
- 购买超级节点
快速入门
- 新手指引
- 快速创建一个标准集群
- 入门示例
- 容器应用部署 Check List
集群配置
- 标准集群概述
- 集群管理
- 网络管理
- 存储管理
- 节点管理
- GPU 资源管理
- 远程终端
应用配置
- 工作负载管理
- 服务和配置管理
- 组件和应用管理
- 弹性伸缩
- 容器登录方式
可观测配置
- 运维可观测性
- 成本洞察和优化
调度配置
- 调度组件概述
- 资源利用率优化调度
- 业务优先级保障调度
- Qos 感知调度
安全和稳定性
- 容器服务安全组设置
- 身份验证和授权
- 应用安全
多集群管理
- 计划升级
- 备份中心
云原生服务指南
- 云原生 etcd
- Prometheus 监控服务
- TKE Serverless 集群指南
- TKE 注册集群指南
实践教程
- 集群
- Serverless 集群
- 调度
- 安全
- 服务部署
- 网络
- 发布
- 日志
- 监控
- 运维
- Terraform
- DevOps
- 弹性伸缩
- 容器化
- 成本管理
- 混合云
- AI
故障处理
API 文档
- History
- Introduction
- API Category
- Making API Requests
- Elastic Cluster APIs
- Resource Reserved Coupon APIs
- Cluster APIs
- Third-party Node APIs
- Relevant APIs for Addon
- Network APIs
- Node APIs
- Node Pool APIs
- TKE Edge Cluster APIs
- Cloud Native Monitoring APIs
- Scaling group APIs
- Super Node APIs
- Other APIs
- Data Types
- Error Codes
- TKE API 2022-05-01
常见问题
- TKE 标准集群
- TKE Serverless 集群
- 运维类
- 隐患处理
- 服务类
- 镜像仓库类
- 远程终端类
- 事件类
- 资源管理类
服务协议
- TKE Service Level Agreement
- TKE Serverless Service Level Agreement
联系我们
词汇表

监控及告警指标列表

Download

聚焦模式

字号

最后更新时间： 2024-12-23 15:29:48

监控
目前容器服务提供了以下维度的监控指标，所有指标均为统计周期内的平均值。
集群监控指标
监控指标
单位
说明
CPU利用率
%
集群整体的 CPU 利用率
内存利用率
%
集群整体的内存利用率
Master&Etcd 和普通节点监控指标
监控指标
单位
说明
Pod重启次数
次
节点内所有 Pod 的重启次数之和
异常状态
-
节点的状态，正常或异常
CPU利用率
%
节点内所有 Pod 的 CPU 使用量占节点总量之比
内存利用率
%
节点内所有 Pod 的内存使用量占节点总量之比
内网入带宽
bps
节点内所有 Pod 的内网入方向带宽之和
内网出带宽
bps
节点内所有 Pod 的内网出方向带宽之和
外网入带宽
bps
节点内所有 Pod 的外网入方向带宽之和
外网出带宽
bps
节点内所有 Pod 的外网出方向带宽之和
TCP连接数
个
节点保持的 TCP 连接数
集群节点更详细的监控指标请参考 云服务器监控。
集群节点数据盘更详细的监控指标请参考 云硬盘监控。
工作负载监控指标
监控指标
单位
说明
Pod 重启次数
次
工作负载内所有 Pod 的重启次数之和
CPU 使用量
核
工作负载内所有 Pod 的 CPU 使用量
CPU 利用率（占集群）
%
工作负载内所有 Pod 的 CPU 使用量占集群总量之比
内存使用量
B
工作负载内所有 Pod 的内存使用量
内存利用率（占集群）
%
工作负载内所有 Pod 的内存使用量占集群总量之比
网络入带宽
bps
工作负载内所有 Pod 的入方向带宽之和
网络出带宽
bps
工作负载内所有 Pod 的出方向带宽之和
网络入流量
B
工作负载内所有 Pod 的入方向流量之和
网络出流量
B
工作负载内所有 Pod 的出方向流量之和
网络入包量
个/s
工作负载内所有 Pod 的入方向包数之和
网络出包量
个/s
工作负载内所有 Pod 的出方向包数之和
如果工作负载对集群外部提供服务，绑定的 Service 更详细的网络监控指标请参考 负载均衡监控。
Pod 监控指标
监控指标
单位
说明
异常状态
-
Pod 的状态，正常或异常
CPU 使用量
核
Pod 的 CPU 使用量
CPU 利用率（占节点）
%
Pod 的 CPU 使用量占节点总量之比
CPU 利用率（占 Request）
%
Pod 的 CPU 使用量和设置的 Request 值之比
CPU 利用率（占 Limit）
%
Pod 的 CPU 使用量和设置的 Limit 值之比
内存使用量
B
Pod 的内存使用量，含缓存
内存使用量（不包含 Cache）
B
Pod 内所有 Container 的真实内存使用量（不含缓存）
内存利用率（占节点）
%
Pod 的内存使用量占节点总量之比
内存利用率（占节点，不包含 Cache）
%
Pod 内所有 Container 的真实内存使用量（不含缓存）占节点总量之比
内存利用率（占 Request）
%
Pod 的内存使用量和设置的 Request 值之比
内存利用率（占 Request，不包含Cache）
%
Pod 内所有 Container 的真实内存使用量（不含缓存）和设置的 Request 值之比
内存利用率（占 Limit）
%
Pod 的内存使用量和设置的 Limit 值之比
内存利用率（占 Limit，不包含 Cache）
%
Pod 内所有 Container 的真实内存使用量（不含缓存）和设置的 Limit 值之比
网络入带宽
bps
Pod 的入方向带宽之和
网络出带宽
bps
Pod 的出方向带宽之和
网络入流量
B
Pod 的入方向流量之和
网络出流量
B
Pod 的出方向流量之和
网络入包量
个/s
Pod 的入方向包数之和
网络出包量
个/s
Pod 的出方向包数之和
Container 监控指标
监控指标
单位
说明
CPU 使用量
核
Container 的 CPU 使用量
CPU 利用率（占节点）
%
Container 的 CPU 使用量占节点总量之比
CPU 利用率（占 Request）
%
Container 的 CPU 使用量和设置的 Request 值之比
CPU 利用率（占 Limit）
%
Container 的 CPU 使用量和设置的 Limit 值之比
内存使用量
B
Container 的内存使用量，含缓存
内存使用量（不包含 Cache）
B
Container 的真实内存使用量（不含缓存）
内存利用率（占节点）
%
Container 的内存使用量占节点总量之比
内存利用率（占节点，不包含 Cache）
%
Container 的真实内存使用量（不含缓存）占节点总量之比
内存利用率（占 Request）
%
Container 的内存使用量和设置的 Request 值之比
内存利用率（占 Request，不包含 Cache）
%
Container 的真实内存使用量（不含缓存）和设置的 Request 值之比
内存利用率（占 Limit）
%
Container 的内存使用量和设置的 Limit 值之比
内存利用率（占 Limit，不包含 Cache）
%
Container 的真实内存使用量（不含缓存）和设置的 Limit 值之比
块设备读带宽
B/s
Container 从硬盘读取数据的吞吐量
块设备写带宽
B/s
Container 把数据写入硬盘的吞吐量
块设备读 IOPS
次/s
Container 从硬盘读取数据的 IO 次数
块设备写 IOPS
次/s
Container 把数据写入硬盘的 IO 次数
告警
目前容器服务提供了以下维度的告警指标，所有指标均为统计周期内的平均值。
集群告警指标
监控指标
单位
说明
CPU 利用率
%
集群整体的 CPU 利用率
内存利用率
%
集群整体的内存利用率
CPU 分配率
%
集群所有容器设置的 CPU Request 之和与集群总可分配 CPU 之比
内存分配率
%
集群所有容器设置的内存 Request 之和与集群总可分配内存之比
Apiserver 正常
-
Apiserver 状态，默认 False 时告警，仅独立集群支持该指标
Etcd 正常
-
Etcd 状态，默认 False 时告警，仅独立集群支持该指标
Scheduler 正常
-
Scheduler 状态，默认 False 时告警，仅独立集群支持该指标
Controll Manager 正常
-
Controll Manager 状态，默认 False 时告警，仅独立集群支持该指标
节点告警指标
监控指标
单位
说明
CPU 利用率
%
节点内所有 Pod 的 CPU 使用量占节点总量之比
内存利用率
%
节点内所有 Pod 的内存使用量占节点总量之比
节点上 Pod 重启次数
次
节点内所有 Pod 重启次数之和
Node Ready
-
节点状态，默认 False 时告警
集群节点更详细的指标告警请参考 云服务器监控 和 云监控创建告警策略。
集群节点数据盘更详细的指标告警请参考 云硬盘监控 和 云监控创建告警策略。
Pod 告警指标
监控指标
单位
说明
CPU 利用率（占节点）
%
Pod 的 CPU 使用量占节点总量之比
内存利用率（占节点）
%
Pod 的内存使用量占节点总量之比
实际内存利用率（占节点）
%
Pod 内所有 Container 的真实内存使用量（不含缓存）占节点总量之比
CPU 利用率（占 Limit）
%
Pod 的CPU使用量和设置的 Limit 值之比
内存利用率（占 Limit）
%
Pod 的内存使用量和设置的 Limit 值之比
实际内存利用率（占 Limit）
%
Pod 内所有 Container 的真实内存使用量（不含缓存）和设置的 Limit 值之比
Pod 重启次数
次
Pod 的重启次数
Pod Ready
-
Pod 的状态，默认 False 时告警
CPU 使用量
核
Pod 的 CPU 使用量
内存使用量
MB
Pod 的内存使用量，含缓存
实际内存使用量
MB
Pod 内所有 Container 的真实内存使用量之和，不含缓存

帮助和支持

本页内容是否解决了您的问题？

您也可以联系销售或提交工单以寻求帮助。

填写满意度调查问卷，共创更好文档体验。

文档反馈

监控指标	单位	说明
CPU利用率	%	集群整体的 CPU 利用率
内存利用率	%	集群整体的内存利用率

tencent cloud

容器服务

监控及告警指标列表

监控

集群监控指标

Master&Etcd 和普通节点监控指标

工作负载监控指标

Pod 监控指标

Container 监控指标

告警

集群告警指标

节点告警指标

Pod 告警指标

帮助和支持