tencent cloud

消息队列 Pulsar 版

动态与公告
新功能发布记录
集群版本更新记录
产品公告
产品简介
TDMQ 产品系列介绍与选型
什么是消息队列 Pulsar 版
产品优势
应用场景
技术原理
产品系列
开源 Pulsar 版本支持说明
与开源 Pulsar 对比
高可用
配额与限制
基础概念
产品计费
计费概述
价格说明
计费示例
续费说明
查看消费明细
欠费说明
退费说明
快速入门
入门流程指引
准备工作
使用 SDK 收发普通消息
使用 SDK 收发高级特性消息
用户指南
使用流程指引
配置账号权限
新建集群
配置命名空间
配置 Topic
连接集群
管理集群
查询消息及轨迹
跨地域复制
查看监控和配置告警
实践教程
客户端使用实践
异常消费者隔离
限流机制说明
交易对账
消息幂等性
消息压缩
迁移指南
单写多读集群迁移方案
虚拟集群平滑迁移至专业集群
API 参考
API 概览
SDK 参考
SDK 概述
SDK 配置参数推荐
TCP 协议(Pulsar 社区版)
安全与合规
权限管理
删除保护
云 API 审计
常见问题
监控相关
客户端相关
服务协议
服务等级协议
TDMQ 政策
联系我们
词汇表

跨地域容灾

PDF
聚焦模式
字号
最后更新时间: 2025-12-24 15:23:00

异地容灾

消息中间件在业务系统的技术架构中,作为非常重要的组件。TDMQ Pulsar 本身支持了多可用区的容灾能力,为了解决当发生地域级灾难时,客户能够快速迁移业务,确保业务的连续性,故而推出跨地域容灾方案。
下面对跨地域容灾方案进行介绍。

在正常场景下,业务在 A 地域访问 Pulsar 服务端,用户需要完成两个主要动作:
1. 跨城网络连接建立,通过云联网 CCN 打通跨地域的 VPC 网络;
2. 元数据同步,通过 Pulsar 控制台建立两地的集群元数据同步,包括命名空间、Topic、订阅、角色等。
异常发生时。TDMQ Pulsar 控制台提供域名解析切换功能,将原 A 地域使用的域名指向到目标容灾 B 地域的集群。如此可避免客户端修改接入点地址,而实现对容灾 B 地域的集群的容灾方案,保障业务的延续性。
A 地域异常恢复后。用户首先需要判断是否要将 B 地域所产生的消息回写至 A 地域,以确保消息的完整性,如需回写,请联系我们的售后团队操作。接着,用户在 B 地域的集群操作接入点域名解析的切回,切回操作执行后,客户端即可正常访问 A 地域。

操作指南

2. 在备份地域创建一个专业集群,在集群购买界面,需要开启跨地域复制开关,并选择要备份的集群;

3. 在控制台的左侧导航栏选择跨地域复制,单击新建链路,配置集群的云数据同步链路:
复制链路名称:为同步链路定义一个名字,不能为空,支持数字字母以及符号 “-_=:.”,长度不超过128个字符。
链路类型:选择元数据。
源集群选择:选择要进行容灾备份的 Pulsar 集群。
目标集群选择:在不同地域选择创建好的目标集群,此处仅会显示「集群 ID」相同的集群。
复制级别:支持集群级、命名空间和 Topic 三个级别。
集群级,适用于集群级的复制。
命名空间级,适用于两地集群日常都是活跃的,不同的命名空间分布在不同地域。
4. 单击保存,完成创建。

云联网网络打通

基于 云联网 打通生产地域和备份地域的网络,建立一个网络访问通道。使得在灾难时,在生产地域的客户端可以跨地域访问到备份集群。
配置详情请参见云联网 操作指南,进行如下操作:

灾难发生时

用户决策,客户端访问切换至备份地域:
1. 通过控制台(如果可用)发起域名解析切换;
2. 如果控制台不可用,客户可联系售后架构师,由 TDMQ 服务侧发起切换。

灾难恢复后

用户决策,客户端访问切回原地域集群:
1. 用户判断是否需要进行消息回写,如需回写,请联系我们的售后团队操作;
2. 通过控制台发起域名切回,客户端正常访问原地域。

注意事项

1. 支持范围

该功能仅专业集群支持。

2. 消息回写

消息回写是在用户将流量切回原地域时的前置判断,目的是为了避免数据丢失,确保数据完整性。请务必在决定是否回写后再进行域名切回。
用户提供信息:
待搬迁的 Topic 列表,例如:集群 ID、命名空间或者具体的 Topic 列表。
起始时间和结束时间,Topic 中发送时间在该范围内的消息为待搬迁数据,参考字段为消息头中的 publishTime。
消息回写的影响:
大量的消息重复,服务端主观上不会去考虑源集群和目标集群的位点同步的复杂状态机,一律将搬迁消息视为新消息对待,即使历史数据已经有同一条消息,也视为两条不同的消息。如果重复消息对业务有一定影响,建议客户端做 幂等处理
较少的消息乱序。

3. 关于角色

源集群下,至少需要有一个角色 Role,可以不绑定到命名空间。目标是为了确保同步时角色 Role 、Token 可以与容灾集群保持一致。

4. 云联网的配置

云联网配置时,两个地域所创建的 VPC CIDR 需要错开。例如:广州10.0.0.0/16 上海10.1.0.0/16 ,如此云联网才能将这两个 VPC 连起来(IP 不会互相冲突)。

5. 域名切换生效时间

域名切换生效时间约需 5s 至 5min,包括两个部分:域名解析切换,客户端断开并重连至新集群的 Broker。

6. 灾难时切换后

灾难发生时,流量切换到容灾集群后,尽量不要在备份集群变更元数据,例如:命名空间属性、新建 Topic 等。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈