tencent cloud

云监控
最后更新时间:2025-10-23 12:00:04
云监控
最后更新时间: 2025-10-23 12:00:04

操作场景

Prometheus 监控服务-云监控模块集成腾讯云产品基础监控数据,通过 Prometheus 监控进行统一采集、存储和可视化。
说明:
数据采集间隔:1分钟。目前不支持更小的采集间隔。
监控数据粒度:1分钟。如果指标不支持1分钟粒度,则选择5分钟粒度。
集成的监控数据包含云产品的标签数据(部分云产品不支持),标签键必须符合正则表达式 [a-Za-Z_][a-Za-Z0-9_]*,否则会被过滤。
不支持多地域。如果云产品分布在多个地域,需要安装多个集成。

操作步骤

2. 在实例列表中,选择并进入对应的 Prometheus 实例。
3. 在实例详情页,选择数据采集 > 集成中心
4. 在集成中心单击云监控,默认进入安装页面。定义集成名称、进行 Exporter 配置和选择对应的云产品。


配置说明

参数
说明
name
集成名称,命名规范如下:
名称具有唯一性。
名称需要符合下面的正则:'^[a-z0-9]([-a-z0-9]*[a-z0-9])?(\\.[a-z0-9]([-a-z0-9]*[a-z0-9])?)*$'。
Region
必填,云产品所在地域。如果云产品不区分地域,则填写任意地域。
Data Collection Latency
单位秒。若设置为0,将忽略原始数据的时间戳;若设置大于0,将上报原始数据的时间戳,由于云产品监控数据上报到基础监控存在一定的延迟,该延迟将会体现在最新的数据上。
拉取数据范围:(当前时间 - 数据采集延迟 - 固定的时间间隔, 当前时间 - 数据采集延迟)。
Instance Refresh Interval
单位分钟,最小值为10。每隔一个实例刷新间隔,集成会重新拉取云产品实例信息。如果修改了实例名、云标签或者增删实例,会在一个实例刷新间隔内更新监控数据。
Instance ID Filtering
选填。不填默认采集主账号下所有实例的数据。键值对形式填写,键是集成定义的云产品 唯一 ID,值是逗号分隔的云产品实例 ID。填写键值对的云产品,只会采集填写的实例。
Cloud Tag Key Filtering
选填。键值对形式填写,一个标签键可以对应多个标签值,以 | 分割。不同的标签键取交集,同一标签键下的多个标签值取并集。对于支持云标签过滤的产品,如果同时配置了实例 ID 过滤,该产品的云标签过滤将不会生效。
Cloud Tag Key Replacement
选填。将不合法的云产品标签键替换为合法值,例如将中文名转换成自定义的英文名。
Cloud Tag Key Operations
集成默认将标签键的大写字母转换成下划线+小写字母。支持对云产品标签键的转换操作:
ToUnderLineAndLower:默认操作。
ToLower:表示全转成小写字母。
NoOperation:表示不做转换。
Dimension Whitelist
选填。部分云产品的维度存在指标名称相同、功能需要开白等问题,默认不采集,可通过该配置开启采集。
lb_public:listener:负载均衡(公网)-监听器维度。
lb_public:target:负载均衡(公网)-后端服务器维度。
lb_public:domain:负载均衡(公网)-转发规则域名维度。
lb_private:listener:负载均衡(内网)-监听器维度。
lb_private:domain:负载均衡(内网)-转发规则域名维度。
apigw_cloudnative:node:云原生 API 网关-节点维度。
vbc:qosid:云联网-调度队列维度。
Label
选填。可以给集成采集到的指标添加额外的自定义标签。
Authentication
鉴权类型:可选择本账号采集跨账号采集
服务角色:本账号采集配置。固定为 CM_QCSLinkedRoleInTMP。
本账号角色:跨账号采集配置。自定义角色,用于获取本账号临时密钥。
目标账号角色:跨账号采集配置。自定义角色,用于获取目标账号临时密钥。
目标账号 uin:跨账号采集配置。目标账号的主账号 ID。
Tencent Cloud Products
勾选想要采集的云产品。
Metric Relabel
选填。Prometheus Operator 原生的 metricRelabelings 配置。配置方式与 Prometheus 抓取配置的 metric_relabel_configs 相同,只有部分字段命名方式不同。

Metric Relabel 配置示例

下面是常用的 metricRelabelings 示例:
metricRelabelings:
- action: labeldrop # 去掉名为 labelA 的 label。regex是正则表达式,多个正则表达式用 | 分隔
regex: labelA
- regex: ins-(.*) # 新增一个名为 id 的 label,其值通过名为 instance_id 的 label 的值经过正则处理后得到。例如 instance_id="ins-a",新得到的 id="a"
replacement: $1
sourceLabels:
- instance_id
targetLabel: id
- targetLabel: region # 新增一个 region="ap-guangzhou" 的 label
replacement: ap-guangzhou
- action: drop # 去掉名为 metricA 或 metricB 的指标
sourceLabels:
- __name__
regex: metricA|metricB

支持的云产品

云产品/指标文档
是否支持采集云标签
唯一 ID
补充说明
cvm
仅支持实例维度指标。
云硬盘
cbs
-
lb_public
默认采集实例维度指标,如需监听器、转发规则域名或后端服务器维度指标,请 提交工单。不同维度的指标名相同,可以通过 monitor_view 标签来区分维度:
实例维度:instance。
监听器维度:listener。
后端服务器维度:target。
转发规则域名维度:domain。
lb_private
默认采集实例维度指标,如需监听器或转发规则域名维度指标,请 提交工单。不同维度的指标名相同,可以通过 monitor_view 标签来区分维度:
实例维度:instance。
监听器维度:listener。
转发规则域名维度:domain。
cmongo
-
cdb
-
redis
-
redis_mem
支持实例维度和节点维度指标。
mariadb
仅支持实例维度指标。
postgres
-
tdmysql
仅支持实例维度指标。
cynosdb_mysql
仅支持实例维度指标。
sqlserver
仅支持实例维度指标。
nat_gateway
-
ckafka
不支持 broker_ip 维度指标。
lb
-
vpngw
-
vpnx
-
不支持标签
vpc_net_detect
-
cdn
不区分地域。
ov_cdn
不区分地域。
COS
cos
存储相关指标延迟过高(2小时左右),不会保留数据的原始时间戳。存储相关指标不支持1分钟粒度,默认拉取5分钟粒度数据。
dc
不区分地域
dcx
不区分地域
dcg
同私有网络/网络连接/专线网关。
轻量应用服务器
Lighthouse
-
云原生 API 网关
apigw_cloudnative
默认采集实例维度和公网负载均衡维度指标,如需节点维度指标,请 提交工单。实例维度与节点维度的指标名相同,可以通过 monitor_view 标签来区分维度:
实例维度:gateway。
公网负载均衡维度:loadbalancer。
节点维度:node。
ces
仅支持实例维度指标。
腾讯云数据仓库 TCHouse-D
cdwdrs
-
数据传输服务
dts
不支持 Kafka 相关维度指标。
云联网
vbc
-
gaap
-
edgeone_l7
-
waf
-
cfs
目前未采集元数据相关指标。
bwp
-
云函数
scf_v2
默认采集别名维度指标,如需版本维度指标,请 提交工单。别名维度与版本维度的指标名相同,可以通过 monitor_view 标签来区分维度:
别名维度:alias。
版本维度:version。
cls
-
apigateway
仅支持 API 维度指标。

指标说明

为了区分不同云产品的指标,云监控集成对云产品指标名(指标文档中的指标英文名)做了转换。指标页中提供了云监控集成支持采集的指标信息,方便用户直接查看和使用。


跨账号采集

注意:
不支持跨站采集(国内站账号与国际站账号不能互相采集)。
场景:账号 A 跨账号采集 账号 B 的监控数据。
配置填写:
在账号 A 下的 Prometheus 监控服务实例中创建云监控集成。
鉴权类型选择跨账号采集
本账号角色选择账号 A 创建的自定义角色。
目标账号角色填入账号 B 创建的自定义角色。
目标账号 uin 填入账号 B 的主账号 ID。


简要流程图



自定义角色

账号 A 创建自定义角色

1. 策略 页面,通过策略语法创建 自定义策略,添加 sts:AssumeRole 权限,该权限用于扮演账号 B 的角色。策略语法如下:
{
"version": "2.0",
"statement": [
{
"effect": "allow",
"action": ["sts:AssumeRole"],
"resource": ["*"]
}
]
}
注意:
如果需要限制权限,例如只能扮演账号 B 的自定义角色,可以将 resource 修改为 "qcs::cam::uin/[账号 B 主账号 ID]:roleName/[账号 B 自定义角色]"。
2. 角色 列表页面,单击新建角色
3. 在弹出的选择角色载体窗口,选择腾讯云产品服务,进入角色信息填写页面。
4. 勾选云服务器(cvm)作为角色载体,使用案例选择云服务器,单击下一步
5. 在策略列表内,勾选第1步创建的策略为角色配置策略,单击下一步
6. 标记角色的标签键和标签值,可不填,单击下一步
7. 输入您的角色名称,单击完成后即完成自定义角色创建。

账号 B 创建自定义角色

1. 在角色列表页面,单击新建角色
2. 在弹出的选择角色载体信息窗口,选择腾讯云账户作为角色载体,进入角色信息填写页面。
3. 在输入角色载体信息页面,云账号类型选择其他主账号账号 ID 填写账号 A 主账号 ID,其它不填,单击下一步
4. 在策略列表内,勾选预设策略 ReadOnlyAccess 为角色配置策略,单击下一步
5. 标记角色的标签键和标签值,可不填,单击下一步
6. 输入您的角色名称,单击完成后即完成自定义角色创建。

常见问题

“数据拉取配置”该怎么配置?

若配置为0,Prometheus 会使用当前时间戳,覆盖数据的原始时间戳。
使用场景:保证数据时间戳的实时性,以最大限度保证 Prometheus 能及时发出告警。
若配置为某个大于0的值 x:
只要是大于0的值,Prometheus 就会保留数据的原始时间戳。
使用场景:与控制台监控页的时间戳保持一致。
延迟拉取数据的时间窗口(延迟量等于 x)。
问题背景:为了兼容云产品监控数据上报链路的时延,Prometheus 默认以 (now-固定时延,now) 的时间范围拉取数据。
使用场景:若个别产品上报链路时延过大,此处需设置 x,使得拉取数据的时间范围变为:(now-固定时延-x,now-x),以保证在这个延迟的窗口内,能更大限度地拉取到数据。

Targets 显示有问题?

无采集对象:刚创建的集成需要等待几分钟才能展示正确的 targets。
(1/2)down:集成采用滚动更新,在新 pod 成功运行之前会继续采集旧 pod,期间就会显示两个 targets。

某个云产品没采集到指标?

已集成下,查看如下信息:
查看实例信息是否含有该云产品,没有则说明未勾选该云产品。
确定 Targets up 状态。
查看指标明细中是否有该云产品指标,若有则等待一分钟后再查询。

确定所选地域下有该云产品实例。
查看是否配置了 Instance ID Filtering Cloud Tag Key Filtering,确定对应配置能获取到该云产品实例。
查看是否配置了 Metric Relabel,确定对应配置没有过滤该云产品指标。

如何重启集成/更新集成版本

1. 已集成下,单击需要操作的集成名称,进入集成编辑页。

2. 直接单击保存


查看监控

前提条件

Prometheus 实例已绑定 Grafana 实例。

操作步骤

1. 登录 Prometheus 监控服务控制台,选择对应 Prometheus 实例进入管理页面。
2. 选择数据采集 > 集成中心,在集成中心页面,找到并单击云监控,在弹出窗口中选择 Dashboard > Dashboard 操作下的安装/升级 Dashboard,单击安装/升级安装对应的 Grafana Dashboard。
3. 选择已集成,在已集成列表中单击 Grafana 图标即可自动打开云监控集成大盘列表,选择对应云产品大盘,查看实例相关的监控数据,如下图所示:










更新动态

云监控集成每次保存,都会将集成更新为最新版本。下面是集成每次版本更新的主要时间节点与内容,可以用来评估集成更新的影响。
时间
更新内容
2025年8月
云数据库 SQL Server 支持地域维度指标;网络探测支持采集云标签和云标签过滤;TI-ONE 新增 cpu、memory 等标签。
指标名变更(集成更新后生效):
qce_apigw_cloudnative_sysrecvnettraffic_sum -> qce_apigw_cloudnative_sysrecvnettraffic_max
qce_apigw_cloudnative_syssendnettraffic_sum -> qce_apigw_cloudnative_syssendnettraffic_max
qce_mqtt_mqttconnectlimitedcount_count -> qce_mqtt_mqttconnectlimitedcount_sum
qce_lb_private_reqavg_avg -> qce_lb_private_reqavg_expr
qce_lb_private_rspavg_avg -> qce_lb_private_rspavg_expr
qce_lb_public_reqavg_avg -> qce_lb_public_reqavg_expr
qce_lb_public_rspavg_avg -> qce_lb_public_rspavg_expr
注意:集成更新后,TI-ONE 指标会产生新时间线;指标名变更涉及云原生 API 网关、消息队列 MQTT 版、负载均衡(公网/内网)。
本页内容是否解决了您的问题?
您也可以 联系销售 提交工单 以寻求帮助。

文档反馈