tencent cloud

Prometheus 监控服务

产品简介
产品概述
产品优势
应用场景
基本概念
相关限制
功能特性
开服地域
购买指南
计费概述
按量付费(后付费)
免费试用介绍
托管采集器付费介绍
归档存储付费介绍
购买方式
欠费说明
快速入门
接入指南
抓取配置说明
自定义监控
EMR 接入
Java 应用接入
Golang 应用接入
Exporters 接入
Nacos 接入
通用组件监控
健康巡检
TKE 集群内安装组件说明
云监控
非腾讯云主机监控
通过 Remote Read 读取云托管 Prometheus 实例数据
Agent 自助接入
Pushgateway 接入
安全组开放说明
操作指南
实例
容器监控
集成中心
数据多写
预聚合
实例诊断
归档存储
告警策略
标签管理
访问控制
Grafana
API 使用指南
容器服务指标
相关资源使用及计费说明
实践教程
自建 Prometheus 迁入
云服务器场景下自定义接入
容器场景监控
TKE Serverless 集群如何放通外网
Prometheus 监控服务如何接入本地 Grafana
Prometheus 实例访问公网
配置 Prometheus 公网地址
Terraform
Terraform 概述
使用 Terraform 管理 Prometheus 实例
使用 Terraform 管理 Prometheus 实例的集成中心
使用 Terraform 采集容器监控数据
使用 Terraform 配置告警策略
常见问题
基础问题
集成容器服务相关
产品咨询
使用&技术问题
云监控问题
服务等级协议
TMP 政策
TMP 隐私协议
TMP 数据处理和安全协议

云监控

PDF
聚焦模式
字号
最后更新时间: 2025-12-30 11:49:46

操作场景

Prometheus 监控服务-云监控模块集成腾讯云产品基础监控数据,通过 Prometheus 监控进行统一采集、存储和可视化。
说明:
数据采集间隔:1分钟。目前不支持更小的采集间隔。
监控数据粒度:1分钟。如果指标不支持1分钟粒度,则选择5分钟粒度。
集成的监控数据包含云产品的标签数据(部分云产品不支持),标签键必须符合正则表达式 [a-Za-Z_][a-Za-Z0-9_]*,否则会被过滤。
不支持多地域。如果云产品分布在多个地域,需要安装多个集成。

操作步骤

2. 在实例列表中,选择并进入对应的 Prometheus 实例。
3. 在实例详情页,选择数据采集 > 集成中心
4. 在集成中心单击云监控,默认进入安装页面。定义集成名称、进行 Exporter 配置和选择对应的云产品。


配置说明

参数
说明
name
集成名称,命名规范如下:
名称具有唯一性。
名称需要符合下面的正则:'^[a-z0-9]([-a-z0-9]*[a-z0-9])?(\\.[a-z0-9]([-a-z0-9]*[a-z0-9])?)*$'。
Region
必填,云产品所在地域。如果云产品不区分地域,则填写任意地域。
Data Collection Latency
单位秒。若设置为0,将忽略原始数据的时间戳;若设置大于0,将上报原始数据的时间戳,由于云产品监控数据上报到基础监控存在一定的延迟,该延迟将会体现在最新的数据上。
拉取数据范围:(当前时间 - 数据采集延迟 - 固定的时间间隔, 当前时间 - 数据采集延迟)。
Instance Refresh Interval
单位分钟,最小值为10。每隔一个实例刷新间隔,集成会重新拉取云产品实例信息。如果修改了实例名、云标签或者增删实例,会在一个实例刷新间隔内更新监控数据。
Instance ID Filtering
选填。不填默认采集主账号下所有实例的数据。键值对形式填写,键是集成定义的云产品 唯一 ID,值是逗号分隔的云产品实例 ID。填写键值对的云产品,只会采集填写的实例。
Cloud Tag Key Filtering
选填。键值对形式填写,一个标签键可以对应多个标签值,以 | 分割。不同的标签键取交集,同一标签键下的多个标签值取并集。对于支持云标签过滤的产品,如果同时配置了实例 ID 过滤,该产品的云标签过滤将不会生效。
Cloud Tag Key Replacement
选填。将不合法的云产品标签键替换为合法值,例如将中文名转换成自定义的英文名。
Cloud Tag Key Operations
集成默认将标签键的大写字母转换成下划线+小写字母。支持对云产品标签键的转换操作:
ToUnderLineAndLower:默认操作。
ToLower:表示全转成小写字母。
NoOperation:表示不做转换。
Dimension Whitelist
选填。部分云产品的维度存在指标名称相同、功能需要开白等问题,默认不采集,可通过该配置开启采集。
lb_public:listener:负载均衡(公网)-监听器维度。
lb_public:target:负载均衡(公网)-后端服务器维度。
lb_public:domain:负载均衡(公网)-转发规则域名维度。
lb_private:listener:负载均衡(内网)-监听器维度。
lb_private:domain:负载均衡(内网)-转发规则域名维度。
apigw_cloudnative:node:云原生 API 网关-节点维度。
vbc:qosid:云联网-调度队列维度。
Label
选填。可以给集成采集到的指标添加额外的自定义标签。
Authentication
鉴权类型:可选择本账号采集跨账号采集
服务角色:本账号采集配置。固定为 CM_QCSLinkedRoleInTMP。
本账号角色:跨账号采集配置。自定义角色,用于获取本账号临时密钥。
目标账号角色:跨账号采集配置。自定义角色,用于获取目标账号临时密钥。
目标账号 uin:跨账号采集配置。目标账号的主账号 ID。
Tencent Cloud Products
勾选想要采集的云产品。
Metric Relabel
选填。Prometheus Operator 原生的 metricRelabelings 配置。配置方式与 Prometheus 抓取配置的 metric_relabel_configs 相同,只有部分字段命名方式不同。

Metric Relabel 配置示例

下面是常用的 metricRelabelings 示例:
metricRelabelings:
- action: labeldrop # 去掉名为 labelA 的 label。regex是正则表达式,多个正则表达式用 | 分隔
regex: labelA
- regex: ins-(.*) # 新增一个名为 id 的 label,其值通过名为 instance_id 的 label 的值经过正则处理后得到。例如 instance_id="ins-a",新得到的 id="a"
replacement: $1
sourceLabels:
- instance_id
targetLabel: id
- targetLabel: region # 新增一个 region="ap-guangzhou" 的 label
replacement: ap-guangzhou
- action: drop # 去掉名为 metricA 或 metricB 的指标
sourceLabels:
- __name__
regex: metricA|metricB

支持的云产品

云产品/指标文档
是否支持采集云标签
唯一 ID
补充说明
cvm
仅支持实例维度指标。
云服务器(内网)
sdn_vm
-
云硬盘
cbs
-
lb_public
默认采集实例维度指标,如需监听器、转发规则域名或后端服务器维度指标,请 提交工单。不同维度的指标名相同,可以通过 monitor_view 标签来区分维度:
实例维度:instance。
监听器维度:listener。
后端服务器维度:target。
转发规则域名维度:domain。
lb_private
默认采集实例维度指标,如需监听器或转发规则域名维度指标,请 提交工单。不同维度的指标名相同,可以通过 monitor_view 标签来区分维度:
实例维度:instance。
监听器维度:listener。
转发规则域名维度:domain。
cmongo
-
cdb
-
redis
-
redis_mem
支持实例维度和节点维度指标。
mariadb
仅支持实例维度指标。
postgres
-
tdmysql
仅支持实例维度指标。
cynosdb_mysql
仅支持实例维度指标。
sqlserver
仅支持实例维度指标。
nat_gateway
-
ckafka
不支持 broker_ip 维度指标。
lb
-
vpngw
-
vpnx
-
不支持标签
vpc_net_detect
-
cdn
不区分地域。
ov_cdn
不区分地域。
COS
cos
存储相关指标延迟过高(2小时左右),不会保留数据的原始时间戳。存储相关指标不支持1分钟粒度,默认拉取5分钟粒度数据。
dc
不区分地域
dcx
不区分地域
dcg
同私有网络/网络连接/专线网关。
轻量应用服务器
Lighthouse
-
云原生 API 网关
apigw_cloudnative
默认采集实例维度和公网负载均衡维度指标,如需节点维度指标,请 提交工单。实例维度与节点维度的指标名相同,可以通过 monitor_view 标签来区分维度:
实例维度:gateway。
公网负载均衡维度:loadbalancer。
节点维度:node。
ces
仅支持实例维度指标。
腾讯云数据仓库 TCHouse-D
cdwdrs
-
数据传输服务
dts
不支持 Kafka 相关维度指标。
云联网
vbc
-
gaap
-
edgeone_l7
-
waf
-
cfs
目前未采集元数据相关指标。
bwp
-
云函数
scf_v2
默认采集别名维度指标,如需版本维度指标,请 提交工单。别名维度与版本维度的指标名相同,可以通过 monitor_view 标签来区分维度:
别名维度:alias。
版本维度:version。
cls
-
apigateway
仅支持 API 维度指标。

指标说明

为了区分不同云产品的指标,云监控集成对云产品指标名(指标文档中的指标英文名)做了转换。指标页中提供了云监控集成支持采集的指标信息,方便用户直接查看和使用。


跨账号采集

注意:
不支持跨站采集(国内站账号与国际站账号不能互相采集)。
场景:账号 A 跨账号采集 账号 B 的监控数据。
配置填写:
在账号 A 下的 Prometheus 监控服务实例中创建云监控集成。
鉴权类型选择跨账号采集
本账号角色选择账号 A 创建的自定义角色。
目标账号角色填入账号 B 创建的自定义角色。
目标账号 uin 填入账号 B 的主账号 ID。


简要流程图



自定义角色

账号 A 创建自定义角色

1. 策略 页面,通过策略语法创建 自定义策略,添加 sts:AssumeRole 权限,该权限用于扮演账号 B 的角色。策略语法如下:
{
"version": "2.0",
"statement": [
{
"effect": "allow",
"action": ["sts:AssumeRole"],
"resource": ["*"]
}
]
}
注意:
如果需要限制权限,例如只能扮演账号 B 的自定义角色,可以将 resource 修改为 "qcs::cam::uin/[账号 B 主账号 ID]:roleName/[账号 B 自定义角色]"。
2. 角色 列表页面,单击新建角色
3. 在弹出的选择角色载体窗口,选择腾讯云产品服务,进入角色信息填写页面。
4. 勾选云服务器(cvm)作为角色载体,使用案例选择云服务器,单击下一步
5. 在策略列表内,勾选第1步创建的策略为角色配置策略,单击下一步
6. 标记角色的标签键和标签值,可不填,单击下一步
7. 输入您的角色名称,单击完成后即完成自定义角色创建。

账号 B 创建自定义角色

1. 在角色列表页面,单击新建角色
2. 在弹出的选择角色载体信息窗口,选择腾讯云账户作为角色载体,进入角色信息填写页面。
3. 在输入角色载体信息页面,云账号类型选择其他主账号账号 ID 填写账号 A 主账号 ID,其它不填,单击下一步
4. 在策略列表内,勾选预设策略 ReadOnlyAccess 为角色配置策略,单击下一步
5. 标记角色的标签键和标签值,可不填,单击下一步
6. 输入您的角色名称,单击完成后即完成自定义角色创建。

常见问题

“数据拉取配置”该怎么配置?

若配置为0,Prometheus 会使用当前时间戳,覆盖数据的原始时间戳。
使用场景:保证数据时间戳的实时性,以最大限度保证 Prometheus 能及时发出告警。
若配置为某个大于0的值 x:
只要是大于0的值,Prometheus 就会保留数据的原始时间戳。
使用场景:与控制台监控页的时间戳保持一致。
延迟拉取数据的时间窗口(延迟量等于 x)。
问题背景:为了兼容云产品监控数据上报链路的时延,Prometheus 默认以 (now-固定时延,now) 的时间范围拉取数据。
使用场景:若个别产品上报链路时延过大,此处需设置 x,使得拉取数据的时间范围变为:(now-固定时延-x,now-x),以保证在这个延迟的窗口内,能更大限度地拉取到数据。

Targets 显示有问题?

无采集对象:刚创建的集成需要等待几分钟才能展示正确的 targets。
(1/2)down:集成采用滚动更新,在新 pod 成功运行之前会继续采集旧 pod,期间就会显示两个 targets。

某个云产品没采集到指标?

已集成下,查看如下信息:
查看实例信息是否含有该云产品,没有则说明未勾选该云产品。
确定 Targets up 状态。
查看指标明细中是否有该云产品指标,若有则等待一分钟后再查询。

确定所选地域下有该云产品实例。
查看是否配置了 Instance ID Filtering Cloud Tag Key Filtering,确定对应配置能获取到该云产品实例。
查看是否配置了 Metric Relabel,确定对应配置没有过滤该云产品指标。

如何重启集成/更新集成版本

1. 已集成下,单击需要操作的集成名称,进入集成编辑页。

2. 直接单击保存


查看监控

前提条件

Prometheus 实例已绑定 Grafana 实例。

操作步骤

1. 登录 Prometheus 监控服务控制台,选择对应 Prometheus 实例进入管理页面。
2. 选择数据采集 > 集成中心,在集成中心页面,找到并单击云监控,在弹出窗口中选择 Dashboard > Dashboard 操作下的安装/升级 Dashboard,单击安装/升级安装对应的 Grafana Dashboard。
3. 选择已集成,在已集成列表中单击 Grafana 图标即可自动打开云监控集成大盘列表,选择对应云产品大盘,查看实例相关的监控数据,如下图所示:










更新动态

云监控集成每次保存,都会将集成更新为最新版本。下面是集成每次版本更新的主要时间节点与内容,可以用来评估集成更新的影响。
时间
更新内容
2025年8月
云数据库 SQL Server 支持地域维度指标;网络探测支持采集云标签和云标签过滤;TI-ONE 新增 cpu、memory 等标签。
指标名变更(集成更新后生效):
qce_apigw_cloudnative_sysrecvnettraffic_sum -> qce_apigw_cloudnative_sysrecvnettraffic_max
qce_apigw_cloudnative_syssendnettraffic_sum -> qce_apigw_cloudnative_syssendnettraffic_max
qce_mqtt_mqttconnectlimitedcount_count -> qce_mqtt_mqttconnectlimitedcount_sum
qce_lb_private_reqavg_avg -> qce_lb_private_reqavg_expr
qce_lb_private_rspavg_avg -> qce_lb_private_rspavg_expr
qce_lb_public_reqavg_avg -> qce_lb_public_reqavg_expr
qce_lb_public_rspavg_avg -> qce_lb_public_rspavg_expr
注意:集成更新后,TI-ONE 指标会产生新时间线;指标名变更涉及云原生 API 网关、消息队列 MQTT 版、负载均衡(公网/内网)。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈