数据备份与灾难恢复
⑴ 数据备份与恢复是什么
容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。
容灾系统,从其对系统的保护程度来区分,可以将容灾系统分为:
1)数据级容灾:
数据容灾指通过建立异地容灾中心,做数据的远程备份,该数据可以是与本地生产数据的完全实时复制,也可以比本地数据略微落后,但一定是可用的。在灾难发生之后要确保原有的数据不会丢失或者遭到破坏,但在数据级容灾这个级别,发生灾难时应用是会中断的。在数据级容灾方式下,所建立的异地容灾中心可以简单地把它理解成一个远程的数据备份中心。数据级容灾的恢复时间比较长,但是相比其他容灾级别来讲它的费用比较低,而且构建实施也相对简单。
数据级容灾根据实时性的要求不一样,可以采用异地备份的方式或者采用存储阵列实时同步或异步同步的方式来实现。
2)应用级容灾
应用容灾是在数据容灾(存储阵列实时同步或异步同步方式)的基础上,在容灾站点建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份)。两个站点间数据同步的技术通过同步或异步复制技术来实现,保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失,让用户基本感受不到灾难的发生,构建完整的、可靠的和安全的业务应用。应用级容灾生产中心和异地灾备中心之间的数据传输可以采用多种数据传输方式;同时应用级容灾系统需要通过专业的容灾软件来实现,可以使多种应用在灾难发生时可以进行快速切换,确保业务的连续性。
采用的主要的技术包括负载均衡、集群技术。数据容灾是应用容灾的基础,应用容灾是数据容灾的目标。
3)业务级容灾
业务容灾是全业务的灾备,除了必要的IT相关技术,还要求具备全部的基础设施。当大灾难发生后,原有的办公场所都会受到破坏,为了维护整体业务系统的持续运行,生产数据中心全部业务系统需要整体进行切换,将全部业务系统依据生产数据中心运行的业务逻辑关系,依次启动相应应用,最终实现业务系统的整体容灾中心运行。
应用/业务级容灾推荐方案:Veritas InfoScale Enterprise(原Storage Foundation系列产品)
概述
Storage Foundation Cluster File System 可降低高可用环境中的复杂性和成本,提供更快的关键业务应用程序恢复速度。
与传统的单实例文件系统实施相比,Cluster File System可以大幅减少应用程序停机时间,提高数据访问速度。由于多台服务器共享相同的存储资源,所以,当发生应用程序故障时,将大大缩短恢复存储在线所需的时间。其高性能文件系统可以跨越异构服务器,实现数据并发访问,同时提高Oracle、SAP 或 Tibco 等应用程序和数据库故障转移速度
主要功能
• 提高应用程序的性能和可伸缩性 — 通过并行处理及动态添加服务器,提高服务级别和性能。Cluster File System可使性能呈线性扩展,最多可扩展至 64 台服务器。
• 缩短应用程序停机时间 — 因为数据要随时可供所有服务器使用,所以,故障转移的时间必须限制为应用程序重启所需的时间。对于 Oracle RAC,一分钟内即可实现恢复,同时大大降低了成本和复杂性。提高了在 Linux 和Unix 环境中的可用性。
• 降低了存储整合成本 — 混搭异构存储资源,实现存储整合。
• 执行在线存储迁移 — 不间断地移动应用程序数据,可满足不断变化的业务和操作要求,而不用考虑存储或平台。
-南京联成科技发展股份有限公司
⑵ 数据备份的灾难恢复能力的等级划分
灾难恢复等级的确定是信息系统灾备建设的重要考虑因素。《规范》将灾难恢复能力划 分为 6 级。
等级一:基本支持。要求数据备份系统能够保证每周至少进行一次数据备份,备份介 质能够提供场外存放。对于备用数据处理系统和备用网络系统,没有具体要求。
等级二:备用场地支持。在满足等级一的条件基础上,要求配备灾难恢复所需的部分数据处理设备,或灾难发生后能在预定时间内调配所需的数据处理设备到备用场地;要求配备部分通信线路和相应的网络设备,或灾难发生后能在预定时间内调配所需的通信线路 和网络设备到备用场地。
等级三:电子传输和设备支持。要求每天至少进行一次完全数据备份,备份介质场外存放,同时每天多次利用通信网络将关键数据定时批量传送至备用场地。配备灾难恢复所 需的部分数据处理设备、通信线路和相应的网络设备。
等级四:电子传输及完整设备支持。在等级三的基础上,要求配置灾难恢复所需的所 有数据处理设备、通信线路和相应的网络设备,并且处于就绪或运行状态。
等级五:实时数据传输及完整设备支持。除要求每天至少进行一次完全数据备份、备份介质场外存放外,还要求采用远程数据复制技术,利用通信网络将关键数据实时复制到备用场地。
等级六:数据零丢失和远程集群支持。要求实现远程实时备份,数据零丢失;备用数据处理系统具备与生产数据处理系统一致的处理能力,应用软件是“集群的”,可实时切换。
由此可见,灾难恢复能力等级越高,对于信息系统的保护效果越好,但同时成本也会急剧上升。因此,灾备建设中,如何确定业务系统的合理的灾备恢复等级是一大难题。在《规范》中也指出了,可以根据成本风险平衡原则(即在灾难恢复资源的成本与风险可能造 成的损失之间取得平衡)来确定。 应建立重要数据的定期数据备份机制,至少每天进行一次完整的数据增量备份,并将备份介质存放在安全区域内。应对关键数据进行同城和异地的实时备份,保证业务应用能够实现实时切 换。应制定灾难恢复计划并定期进行测试,确保各个恢复程序的正确性和计划整体的有效性。