容灾切换:可视化,RPO/RTO ≈ 0
QPlus 不仅支持备份数据保护、支持一站式拉起开发测试库,还支持在主库出现物理故障时,临时接管数据库提供业务服务。目前提供 switchover/switchback 的零丢失主备切换,还支持 Failover 的主库故障情况下应急接管。
-
主备切换(Switchover)
-
核心指标:RPO=0,RTO≤1 分钟
-
适用场景:
-
定期容灾演练
-
硬件升级维护
-
业务灰度发布
-
-
-
应急接管(Failover)
-
核心指标:RPO≤10 秒,RTO≤3 分钟
-
适用场景:
-
主库不可用(宕机/网络中断)
-
数据物理损坏
-
区域性灾难
-
-
下面我们以 oceanbase 库 OceanBasetest1 的 switchover/switchback 为例演示白屏化切换。
主备切换(Switchover)
用户可前往 Oceanbase->容灾管理页面,选择 OceanBasetest1 集群,点击【主备切换】按钮开始进行 switchover 主备切换
主备切换前确认
切换前需要客户选择本次哪些租户需要切换到 QPlus 上。由于主备切换会将主租户降级(源主租户将无法提供业务服务)为了避免用户误操作,用户需要输入验证码才可进行切换。
开始主备切换
-
预检阶段(关键检查项):
集群连接检查
-
远端库连接
-
本地库连接
-
检查数据库版本
租户状态检查
这里会预检查所有要切换的租户是否满足切换切换条件
-
主租户角色验证
-
日志流状态检查
-
主备同步延迟≤100ms
-
-
切换阶段
所有租户检查满足要求后,会自动弹出开始切换的按钮,点击【开始切换】才会真正的发起主备切换
主备切换发起后会自动对所有选中的租户并行进行切换,在右上角可以看到当前处于等待、跳过、取消、成功和失败的各个状态的租户个数。实际的每个租户切换步骤如下:
-
主备租户角色调换,主租户切换为备租户,备租户切换为主租户
-
验证角色切换状态
-
设置原主租户日志恢复源
-
检查新同步状态
-
验证原主租户日志恢复源设置
查看切换结果
在「已容灾库列表」看板中可以看到 OceanBasetest1 集群已经切换成功
容灾回切(switchback)
QPlus 上的租户完成容灾演练任务以后,客户可以进入 OceanBase->容灾管理,在已切换容灾库列表中,选择要回切的集群,点击【回切】按钮,将业务回切回原主集群。
在启动回切操作前的确认
回切前用户也需要确认需要回切哪些租户,并且输入验证码以确认业务允许回切回原主集群。
预检验证
-
集群检查:包括远端库检查、 本地库检查、主备数据库版本检查
-
租户检查:这里会检查所有要回切的租户是否满足回切条件,包括主备租户角色检查、日志流状态检查以及同步延迟检查
所有租户回切检查成功后,系统会自动弹出开始切换的窗口,用户可点击【开始切换】按钮真正发起回切操作
实时状态监控
在页面右上角的任务状态面板中,可查看租户回切的实时进展:可以看到当前处于等待、跳过、取消、成功和失败的各个状态的租户个数。
回切完成,系统自动将原主库 OceanBasetest1 移入未切换容灾库列表