如下图所示,深信服容灾流程分为数据实时备份和业务故障恢复两个主操作,备份操作有:本地备份和异地同步(同步数据到备站点),恢复操作有:本地恢复(恢复到主站点)和异地恢复(恢复到备站点)并将业务回迁到主站点,没有在图中展示的步骤还有容灾初始化和容灾演练。
下面将对容灾的7个步骤进行详细讲解
依次为:容灾初始化、本地备份、异地同步、本地恢复、异地恢复、业务回迁、容灾演练。
1、容灾初始化
- 配置容灾计划,在主备站点同步配置信息。
- 在恢复站点自动进行占位虚拟机的创建和虚拟机配置的同步。
- 在恢复站点预先配置网络拓扑。(用户手动操作,建议预先配置)。
- 配置主备站点之间的容灾链路。(容灾口最好是单独网口,不要跟业务口或集群口复用,防止容灾进程抢占业务流量,集群间和集群内的网口都需要配置)
- 配置保护组,设置保护组内虚拟机恢复开机的优先级。
- 配置恢复计划。
2、本地备份和异地同步数据
根据RPO需求制定本地备份策略,提供普通备份和CDP两种备份策略,对应不同的异步数据同步方式, 有以下两种方案:
1)小时、天、周级别的 RPO:本地定期备份+异地同步备份文件
- 主站点根据设定的 RPO 值定期触发虚拟机执行备份,生成备份文件(如 1 小时一备)。
- 检测到备份完成,触发容灾传输任务,将备份文件传输到备站点。
- 支持断点续传、压缩传输、加密传输、对比传输、负载均衡、动态流控。
- 配置异地保护策略时,可设置 RPO 告警阈值,防止因网络抖动或网络带宽不足导致短时间 RPO 不满足从而频繁告警的情况。告警阈值分为预警和告警,预警信息在容灾状态和数据概览页面体现;告警信息会在告警页面展现,同时可通过邮箱、短信等方式将告警信息及时同步给用户。
- 支持将备份文件制作成种子文件,支持对种子进行加密打包,可通过外置硬盘设备传输种子文件。
- 支持对备份文件进行归档,只支持按月进行归档。
2)秒级别或分钟级别 RPO:本地 CDP 备份+异地同步 IO 日志
- 主站点根据设定的 RPO 值定期生成 RP 点,即 IO 日志,根据设定的备份频率定期
生成备份文件。 - 将主站点 CDP 产生的 IO 日志数据以 IO 重放的方式实时同步到备站点,并及时将备份文件同步到备站点。
- 支持断点续传、压缩传输、加密传输、对比传输、负载均衡、动态流控、降级处理。
- 配置异地保护策略时,可设置 RPO 告警阈值,防止因网络抖动或网络带宽不足导致短时间 RPO 不满足从而频繁告警的情况。告警阈值分为预警和告警,预警信息在容灾状态和数据概览页面体现;告警信息会在告警页面展现,同时可通过邮箱、短信等方式将告警信息及时同步给用户。
3、本地恢复
当发生本地部分虚拟机业务不可用的故障时,支持从本地备份直接拉起虚拟机,快速恢复业务运行。
4、异地恢复
当主站点整个数据中心发生故障导致业务不能本地恢复时,选择异地恢复方式,此为灾难后恢复;还有非故障场景下的业务恢复,此为计划内恢复。
1)灾难后恢复:
在发生意外灾难后,部分未同步数据已经丢失,恢复站点默认按照最新的恢复点进行恢复,优先保障业务尽快上线。
2)计划内恢复:
在发生意外灾难后,部分未同步数据已经丢失,恢复站点默认按照最新的恢复点进行恢复,优先保障业务尽快上线。
5、业务回迁
主站点是客户业务运行的生产环境,备站点环境配置往往不如主站点,因此当业务在异地(备站点)恢复后,需要将业务回迁到主站点;有如下数据需要顺序回迁:全量镜像文件、虚拟机配置文件、定时产生的增量备份文件和IOlog实时数据。
业务回迁主要场景有备站点云主机关机状态和云主机开机状态。如果备站点云主机是开机状态,则会自动定时执行备份和同步主备站点数据差异量,待手动关机后再执行回迁;当备站点云主机是关机状态,则执行一次数据备份和同步主备站点数据差异量后,直接执行回迁。
根据主站点故障场景和备站点数据情况,提供全量回迁和增量回迁2种回迁方式。
联系我们