对于双赢体系,根据业务的关键性和对用户的影响,建立合理的体系 RTO。比如,对于关键的交易功能,RTO 可能设为 30 分钟内,这意味着必须在灾难出现后, 30 几分钟内恢复系统,以减少对用户交易的影响。对于一些非关键的查询功能,RTO 能适当放宽到几小时。
双赢系统云计算解决方案的灾难恢复计划
在云计算环境里,利用云存储的快照功能按时和实时地备份系统里的虚拟机和数据库。比如,重要数据库一小时快照一次,系统工作环境每日快照备份一次。
根据客户信息,挑选分布式架构和多副本技术,以确保数据在不同存储节点和数据中心有多个集团。该集团能够跨地域存放,以防止地区灾难对数据的毁坏。
备份双赢全面的网络配置、服务器配置和应用软件配备。配置信息可按时备份到安全存储部分,保证灾难出现后尽快恢复综合配置环境。
在云计算平台上布署综合监控系统,实时监测云主机技术参数(如 CPU 利用率、内存利用率等)、手机流量、存储状态等。同时,监管应用软件的运行状态,如交易成功率、响应时间等。当这些指标起伏异常时,马上发出警告。
依据入侵检测系统、防火墙日志等,检验可能发生的黑客入侵和安全漏洞。如有异常访问模式或安全威胁,立即启动灾难解决方法。
依据备份数据及设备,运作恢复程序。利用云平台的自动部署功能,尽快恢复虚拟机和应用软件。假如数据库出现异常,从最近合理的快照中恢复数据,并通过日志回望等技术将数据修复到新的状况。
系统恢复后,逐渐引导用户再度浏览系统,对关键工作内容进行检测和验证。比如,对交易功能进行模拟交易检测,以确保用户可以正常交易和交易操作,并密切关注系统性能和用户反馈。
培训参加灾难修复的专业人士和管理人员,掌握灾难修复方案的过程、分别的职责和专业技能。包含如何启动备份恢复,怎样处理各种故障情景。