阅读以下关于在线教育系统容灾设计的叙述,在答题纸上回答问题1-3。
【说明】
某在线教育平台同时提供直播授课、点播授课、课程订购和学习记录管理等业务。直播业务对实时性和连续性要求高,要求 RPO 不超过 5 分钟、RTO 不超过 1 分钟;点播业务允许小时级故障恢复。平台保存用户信息、订购记录、课程资源和学习记录,项目组需要在热备、冷备、双活以及同步复制、异步复制等方案中进行选择,并从成本、运维复杂度和演练必要性角度分析容灾方案。
说明冷备、热备和双活的区别,并结合 RPO/RTO 为直播和点播业务选择方案。
冷备是备用系统平时不承担业务,故障后需要启动、恢复数据和切换,成本低但 RTO 较长;热备是备用系统持续同步数据并处于待命状态,故障后可较快切换,成本和复杂度居中;双活是两个或多个站点同时对外提供服务,故障时业务可快速转移,RTO 最短但成本和运维复杂度最高。直播业务要求 RPO≤5 分钟、RTO≤1 分钟,宜采用热备或双活,若要求极高连续性可选双活;点播业务可接受小时级恢复,可采用冷备或低成本异步备份方案。
RPO 表示最多可丢失的数据时间窗口,RTO 表示可接受的恢复时间。直播业务正在进行实时授课,用户对中断非常敏感,1 分钟 RTO 基本排除了纯冷备;点播业务中断影响相对小,小时级恢复说明可以用成本更低的冷备或异步备份。答题时不要只背“冷备便宜、双活贵”,要把业务等级和 RPO/RTO 对应起来:业务越实时、RTO 越短,越倾向热备/双活;业务越可延迟恢复,越可选择冷备。
容灾题的核心不是背名词,而是把业务等级映射到 RPO/RTO。直播业务正在发生,RTO≤1 分钟说明恢复时间极短,RPO≤5 分钟说明数据丢失窗口也很小,因此至少需要热备,关键链路可考虑双活;点播业务允许小时级恢复,可以采用冷备、异步备份和对象存储冗余来控制成本。