tencent cloud

文档反馈

支持的事件和指标

最后更新时间:2024-03-08 13:22:08

    概述

    DTS 支持对数据迁移、数据同步、数据订阅任务过程中的事件和指标进行监控并设置报警规则,在事件触发或者指标发生异常时,及时通知用户采取措施。
    说明:
    当前支持事件告警的场景为 MySQL、MariaDB、Percona、TDSQL MySQL-C 的迁移、同步和订阅链路。
    当前支持指标告警的场景为 MySQL、MariaDB、Percona、TDSQL MySQL-C、TDSQL MySQL 的迁移、同步和订阅链路。

    支持的事件

    事件名称
    说明
    数据迁移任务中断
    数据迁移任务过程中,当任务发生异常中断时(不含用户主动中断任务的场景),触发告警。
    数据同步任务中断
    数据同步任务过程中,当任务发生异常中断时(不含用户主动中断任务的场景),触发告警。
    数据订阅任务中断
    数据订阅任务过程中,当任务发生异常中断时(不含用户主动中断任务的场景),触发告警。
    云 API 操作事件(基于云审计投递)
    对云API操作过程中的异常中断触发告警。
    控制台操作事件(基于云审计投递)
    对控制台操作过程中的异常中断触发告警。
    小程序操作事件(基于云审计投递)
    对小程序操作过程中的异常中断触发告警。

    数据迁移支持的指标

    说明:
    当前仅支持在增量迁移阶段获取实时监控的指标数据。
    指标名称
    单位
    说明
    源实例数据抽取 RPS
    Count/s
    DTS 每秒读取的源实例的数据行数。
    目标数据装载 RPS
    Count/s
    DTS 每秒迁移到目标实例的数据行数。
    数据迁移延迟时间
    s
    目标实例和源实例的时间延迟。
    计算方法:源实例当前时间减去目标实例当前正在执行的最新一条源实例 Binlog Event 中记录的时间。
    “数据迁移延迟时间”的计算依赖于源库的增量 Binlog,所以当源库长时间没有 DDL 或者 DML 操作时,该指标会逐步增大,无法反应真实的同步延迟时间(如出现值为“-1”,表示存量数据迁移完成,一直没有增量数据的刷新)。如遇到这种情况,用户可以通过在源端执行 SQL 语句来让该指标刷新,进而得到真实的指标数据。
    数据迁移延迟数据量
    MBytes
    目标实例和源实例的数据差距。
    计算方法:源实例最新的 Binlog Event 文件位点减去目标实例当前正在执行的最新一条源实例 Binlog Event 的文件位点。 当这两个位点跨越 Binlog 文件时,该值有估算成分。
    当源库长时间没有 DDL 或者 DML 操作时,该指标会逐步增大,无法反应真实的同步延迟时间(如出现值为“-1”,表示存量数据迁移完成,一直没有增量数据的刷新)。

    数据同步支持的指标

    说明:
    当前仅支持在增量同步阶段获取实时监控的指标数据。
    指标名称
    单位
    说明
    源实例数据抽取 RPS
    Count/s
    DTS 每秒读取的源实例的数据行数。
    目标数据装载 RPS
    Count/s
    DTS 每秒迁移到目标实例的数据行数。
    数据同步延迟时间
    s
    目标实例和源实例的时间延迟。
    计算方法:源实例当前时间减去目标实例当前正在执行的最新一条源实例 Binlog Event 中记录的时间。
    “数据同步延迟时间”的计算依赖于源库的增量 Binlog,所以当源库长时间没有 DDL 或者 DML 操作时,该指标会逐步增大,无法反应真实的同步延迟时间(如出现值为“-1”,表示存量数据迁移完成,一直没有增量数据的刷新)。如遇到这种情况,用户可以通过在源端执行 SQL 语句来让该指标刷新,进而得到真实的指标数据。
    数据同步延迟数据量
    MBytes
    目标实例和源实例的数据差距。
    计算方法:源实例最新的 Binlog Event 文件位点减去目标实例当前正在执行的最新一条源实例 Binlog Event 的文件位点。 当这两个位点跨越 Binlog 文件时,该值有估算成分。
    当源库长时间没有 DDL 或者 DML 操作时,该指标会逐步增大,无法反应真实的同步延迟时间(如出现值为“-1”,表示存量数据同步完成,一直没有增量数据的刷新)。

    数据订阅(Kafka版)支持的指标

    指标名称
    单位
    说明
    Binlog 解析延迟
    Count
    数据订阅服务已解析的 Binlog Event 与源库最新产生的 Binlog Event 之间的 GTID 个数差距。
    当源库长时间没有 DDL 或者 DML 操作时,该指标会逐步增大,无法反应真实的同步延迟时间。如出现值为“-1”,表示源库一直没有数据刷新。
    说明:
    该指标仅针对 MySQL/MariaDB/Percona/TDSQL-C MySQL/TDSQL-C MySQL 数据库。
    订阅服务与源库的 LSN 差距
    MBytes
    数据订阅服务已解析的日志位点与源库最新产生的日志位点之间的 SLN 差距。
    说明:
    该指标仅针对 TDSQL PostgreSQL 数据库。
    每秒解析事务数
    Count/s
    DTS 每秒从源库 Binlog 抽取解析的事务数。

    数据订阅支持的指标

    指标名称
    单位
    说明
    数据解析 GTID
    Count
    订阅服务正在解析的 Binlog 与源库最新产生的 Binlog 之间的 GTID 差距个数。
    SDK 确认延时
    s
    SDK 每消费一条消息,会向服务端回复确认,该指标为 SDK 生产和消费的时间差,即 SDK 最后一次回复的消息在源库产生的时间,与订阅服务器的机器时间差。
    每秒事务数
    Count/s
    消费端每秒处理的事务数。
    待确认队列使用率
    %
    客户端已经消费完成的消息,会向服务端发送确认,等待向服务端确认的消息会加入待确认队列,该指标为客户端缓存的消费队列中,待向服务端确认的消息队列占比。
    当待确认队列占满时,该指标值为100%,出现该情况表明客户端有某条消息因为自身程序异常没有调用到 AckAsComsumed。
    内部解析队列使用率
    %
    客户端在消费消息之前,会将消息进行解析并放在内部解析队列中,该指标用于反映解析队列的使用率。
    消息队列使用率
    %
    客户端运行时,将消息从订阅服务端下载并缓存到消息队列中,该指标用于反映消息队列的使用率。
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持