新数据中心如何解决数据的灾备以及安全问题

  1. 云栖社区>
  2. 博客>
  3. 正文

新数据中心如何解决数据的灾备以及安全问题

老牛的博客 2013-04-07 14:48:30 浏览434
展开阅读全文

如何应对“将鸡蛋放在一个篮子里”所带来的风险?对于信息化应用而言,灾备系统的建设已成为备受关注的热点和重点。

概述

数据中心是数据大集中而形成的集成IT应用环境,它是各种IT应用服务的提供中心,是数据计算、网络、存储的中心。数据中心实现了安全策略的统一部署,以及对IT基础设施、业务应用和数据的统一运维管理。

数据大集中的同时也对数据安全提出了更高的要求,如何应对“将鸡蛋放在一个篮子里”所带来的风险,已成为备受关注的重点。面对频频发生的雪灾、地震等自然灾害,对于信息化应用而言,灾备系统的建设也已成为热点。随着2007年11月《信息系统灾难恢复规范》正式成为国家标准,许多用户将从观望、徘徊转向实际应用。对于正处于服务转型期的电信运营商来说,借助灾备中心应用热潮,提供更有价值的信息化服务,改变原有的、单一的网络接入商角色,是值得把握的一次良好机会。

灾难备份概念介绍

1. 灾难备份的分类

灾备从应用层次,大体可分为三个类别:数据级别、应用级别和业务级别。从用户整个业务连续性的保障程度来看,其高可用性级别也随之逐级提高。

1) 数据级别

数据级别灾备的关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。数据级别灾备是保障数据可用的最低底线,当数据丢失时能够保证应用系统可以重新得到所有数据。这种方案的优点是投入低,构建简单。

2) 应用级别

对于业务应用繁多,并且系统需要保持7*24小时连续运行的企业来说,显然需要高级别的应用灾备系统来满足其需求。应用级备份是在数据级灾备的基础上,在备份站点同样构建一套应用系统。应用级灾备系统能提供不间断的应用服务,使用户的服务请求能够透明地继续运行,保证信息系统提供的服务完整、可靠和安全,完全不受灾难的影响。一般来说,应用级灾备系统需要通过更多软件来实现,它可以使企业的多种应用在灾难发生时进行快速切换,确保业务的连续性。

3) 业务级别

即使构建了数据级灾备和应用级灾备,也都还是在IT范畴之内,对于正常的业务而言,仅有IT系统的保障还是不够的。当一场大的灾难发生时,原有的办公场所都会受到破坏,除了需要原有的数据和原有的应用系统,还需要工作人员在一个备份的工作场所能够正常的开展业务,这就要包括原有工作环境中的一切必须工作设备(如电话、电传、扫描和打印等)。因此用户需要构建最高级别的业务级别灾备,这一级别灾备的大部分内容是非IT系统。

2. 灾难备份的等级划分

以下依据国标GB20988-2007-T《信息安全技术信息系统灾难恢复规范》来说明灾难恢复的等级要求。

1) 灾难恢复资源要素

支持灾难恢复各个等级所需的资源可分为如图1所示的7个要素:

图1 灾难恢复资源要素

 数据备份系统

数据备份系统通常由数据备份的硬件、软件和数据备份介质组成,如果是依靠电子传输的数据备份系统,还包括数据备份线路和相应的通信设备。数据备份系统是灾难备份系统的最基本要素,如何将数据(包含系统、应用和业务数据)完整的、实时的复制到灾备中心是灾备系统建设需要重点考虑的事项。

 备用数据处理系统

备份数据处理系统是指备用的计算机、外围设备和软件。

 备用网络系统

备用网络系统是最终用户用来访问备用数据处理系统的网络,包括备用网络通信设备和备用数据通信线路。

 备用基础设施

备用基础设施是灾难恢复所需的、支持灾难备份系统运行的建筑、设备和组织,包括介质的场外存放场所、备用的机房及灾难恢复工作辅助设施,以及容许灾难恢复人员连续停留的生活设施。

 专业技术支持能力

专业技术支持能力是对灾难恢复的运转提供支持和综合保障的能力,以实现灾难恢复系统的预期目标。包括硬件、系统软件和应用软件的问题分析和处理能力、网络系统安全运行管理能力、沟通协调能力等。

 运行维护管理能力

运行维护管理能力包括运行环境管理、系统管理、安全管理和变更管理等内容。

 灾难恢复预案

灾难恢复预案是保障关键业务功能在灾难备份中心的恢复和重续运行、主系统的灾后重建和回退工作,以及突发事件应急响应的组织流程和预案。

2) 灾难恢复能力评价指标

一般地,灾难恢复能力采用三个主要的容灾指标RTO、RPO、NRO作为评判依据:

 恢复时间目标RTO(Recovery Time Object)

该指标是容灾恢复的时间指标,从广义上来说是从灾难发生造成业务中断,直到通过各种方法恢复业务所需要的时间。通常越短的RTO意味着越高的容灾能力。另一个狭义的RTO指标是指从决定进行容灾切换到业务可以继续运行所经过的时间。一般用狭义的RTO指标评价IT层面的容灾能力。

恢复点目标RPO(Recovery Point Object)

宕机导致的停机不是故障影响的全部,宕机带来的另一种影响对企业的损害可能更大,那就是永久性数据丢失:宕机以前的数据没有保存到在线数据库或文件中。

宕机之后数据开始恢复的时间点称之为恢复点,恢复点指标RPO,就是当业务恢复后,可以达到与灾难发生前那个时间点相同的工作状态。通常RPO对应着灾难造成的数据丢失程度,如果RPO为0,就相当于没有丢失任何数据。但这种理想状态往往是无法达到的,这就涉及到业务回滚。业务恢复与回滚的不同之处在于业务恢复不考虑数据丢失,特别是对于没有前后连贯性的一类业务,新的业务处理不需要以前的业务结果,当灾难恢复完成后,可以直接进行新的业务;而业务回滚是与数据丢失相关的,丢失的数据必须通过各种方法进行修复,可能需要手工完成,新业务开始运转后会持续很长的时间,这段时间就是业务回滚时间,也可以叫做修复灾难造成的损失时间。

 网络恢复目标NRO(Network Recovery Object)

网络恢复时间是指当灾难发生后,最终用户切换到备用网络系统,并且可以通过备用网络访问灾备中心所需的时间。一个快速收敛聚合的网络可以为应用和数据的迁移提供可靠的传输路径。NRO可以滞后于RTO,也可能超前于RTO。

图2 RPO/RTO/NRO三者关系

3) 国标灾难恢复等级

以下是对国标灾难恢复等级的简要描述,表1中用蓝色字体表明了不同等级对备用网络系统的要求。

表1 国际灾难恢复等级描述

SHARE78

《信息系统灾难恢复规范》GB/T 20988-2007

Tier-0

无异地备份数据

第1级

基本级。备份介质场外存,安全保管、定期验证。对备用网络没有要求。

Tier-1

有数据备份,无备用系统

Tier-2

有数据备份,有备用系统

第2级

备份场地支持。网络和业务处理系统可在预定时间内调配到备份中心。配备部分通讯线路和相应的网络设备,或在灾难发生后能在预定的时间内调配所需的通讯线路和网络设备到备用场地。

Tier-3

电子链接

第3级

电子传输和部分设备支持。灾备中心配备部分业务处理和网络设备,具备部分通讯链路。

Tier-4

使用快照技术拷贝数据

第4级

电子传输和完整设备支持。数据定时批量传送,网络/系统始终就绪。配备灾难恢复所需的通讯链路;配备灾难恢复所需的网络设备,并处于就绪状态。

Tier-5

交易的完整性

第5级

实时数据传输及完整设备支持。采用远程复制技术,实现数据实时复制,网络具备自动或集中切换能力,业务处理系统就绪或运行中。配备灾难恢复所需的通讯链路;配备灾难恢复所需的网络设备,并处于就绪状态;具备通讯网络自动或集中切换能力。

Tier-6

少量或无数据丢失

第6级

数据零丢失和远程集群支持。数据实时备份,零丢失,系统/应用远程集群,可自动切换,用户同时接入主备中心。配备与主系统相同等级的通讯线路和网络设备;备用网络处于运行状态;最终用户可通过网络接入主中心和备用中心。

灾备服务实践

在规划和建设灾难备份和恢复系统时,用户经常面临着许多同样的困惑,例如,对灾难恢复建设不熟悉、缺乏经验;管理、技术、运维都面临调整;垂直行业无标准或标准混乱;投资保护和长远规划难以兼顾等等。如何在满足业务需求的基础上,摆脱灾备系统成本高、建设难的困扰?杭州电信为杭州市政府搭建的共享灾备平台值得借鉴。

作为整个杭州市的数据集中备份平台,杭州市政府共享灾备中心要为各个市级部门的非涉密信息系统的重要数据实现集中灾难备份,通过提供统一的数据备份平台,在确保数据安全的基础上,满足相关单位应用级、数据级的容灾备份需求。由于杭州市政府各相关委办局IT系统建设程度不一,数据存储形式复杂,要搭建起一个同时满足各种不同复杂需求的统一灾备中心,的确是一项非常“棘手”的任务。杭州市政府经过综合对比(见表2),最终认定共享灾备服务是一种较合适的选择。杭州电信在国内率先搭建起了全外包式的政府共享灾备中心,帮助杭州市政府多个委办局实现数据集中备份,开创了运营商提供共享式数据保护外包服务的先河。

表2 杭州市政府灾备平台三种建设方式对比

 

政府自建

委托第三方

共享灾备

建设机制

采购各种设备自己建设 

交付给第三方专业集成商或代理商建设和管理

从建设简化为采购

业务实现难易度

系统整合极其复杂,出现问题多厂家相互推卸责任

实际实现结果和预想结果相差甚远

按需采购,即购即用,系统可靠运行

可升级和可迁移性

一旦升级又要考虑设备兼容性和设备的整合,数据迁移不方便

基本是将自建的烦恼委托第三方,但是必须全程主导

按需调整,随时可以升级或迁移,随着部门业务的发展,设备可以方便的利旧重复利用,大大节约系统升级费

成本问题

投资大,各系统均花费巨大,维护更是很大一部分

投资巨大,维护成本严重受限于第三方的水平

购买即可使用,运行成本低,维护简单,而且有运营商、厂商直服

何种用户采用

对组织财力、能力经验均要求很高,特别是IT技术实力强

需要全部灾备服务而无能力、经验建设

任何用户

综合优势比较

1. 共享灾备方案总体介绍

共享灾备解决方案利用数据保护技术、多对一的远程复制技术、数据加密和安全传输技术,不仅实现了多个用户生产中心到运营商共享灾备中心的灾备,还实现了灾备平台的集中管理和基础架构共享。

图3 共享灾备平台总体架构图

如图3所示,共享灾备平台通过统一数据管理平台和虚拟化平台形成统一的管理中心,并提供运营商业务平台接口,作为灾备运营的管理平台。运营商对共享灾备平台进行运营管理时,底层设备对使用者相当于是透明的,运营管理人员可以:

 动态分配和扩展备份空间,进行统一的资源配置;

 动态设置和改变备份策略,进行统一的备份策略设置;

 在同一管理界面中同时管理各种存储设备,异构厂家磁盘阵列逻辑资源可以通过虚拟化后纳入灾备平台的统一管理;

 对全网存储设备进行故障监控。

2. 共享灾备方案特点

共享灾备解决方案充分整合了IP网络、存储、安全等领域的技术,采用层次化管理结构、开放的体系架构和标准的技术实现,使灾难备份系统建设突破了长期困扰的兼容性、成本和管理性桎梏,为运营商提供数据中心增值服务提供了可能。该方案设计具备如下特点:

1) 适合广域部署的IP存储

跨广域网的数据备份在技术上至少有三个要点:如何保障数据传输的带宽,如何保障数据传输的安全性,如何保障在复杂网络结构下的数据传输。解决的核心是以IP为代表的标准化技术。将10Gb网络技术、虚拟化技术、远程复制技术和镜像技术、CDP连续数据保护技术、WSAN广域存储技术、存储网络安全技术等进行一体化融合后,推出了新一代IP SAN。IP SAN的出现使得广域存储的部署变得简单。

2) 逻辑上独立,物理上统一的灾备平台

给每个用户划分逻辑上独立的存储空间,对用户生产中心的数据进行保护。这些“独立”的存储空间在物理上也可以集中在同一台存储设备上,这样能很好的提高存储设备的资源利用率,提高用户的投资回报率。

3) 业务分层、统一管理、弹性架构

共享灾备解决方案由资源层、虚拟层、业务层三个层次构建。其中,虚拟层的作用是一方面将网络、存储、安全等设备资源化,另一方面通过屏蔽异构厂家的差异化向业务层提供统一的接口。这三个层次均基于IP标准技术,提供良好的扩展及兼容性。

图形化的管理界面和统一的管理平台,符合业内流行趋势,使管理变得更加集中、更加容易。还可以提供不中断业务的在线可视化管理。

另外,基于IP技术的弹性扩展架构,使得灾备平台可以统一规划、分期建设,并按业务发展要求进行扩展。同时,原有的存储设备可以通过虚拟化设备的方式统一接入,保护IDC的已有投资。

4) 统一数据管理平台

只有实现对整个灾备中心乃至数据的高效管理,才能保证灾备中心长期稳定运营,提供高质量的服务。作为灾备中心的核心,UDM统一数据管理平台能够集中管理所有的存储设备,统一制定存储策略,实现资源化管理。通过UDM和虚拟化数据管理平台的融合,实现运维管理和用户服务查询、管理等功能,帮助运营商实现灾备业务运营。

图4 UDM用户界面

5) 安全特性支持

共享灾备解决方案全面地考虑到业务和数据的安全问题,从客户的数据中心到运营商的灾备中心均全程支持安全保护。

 客户数据中心到运营商灾备中心支持采用加密技术,保护数据的传输安全,并支持加密数据的存储;

 运营商灾备中心采用防火墙和IPS(入侵防御系统)进行深度安全防护,保护数据中心免受黑客、病毒等入侵;

 灾备中心支持接入主机的AAA认证(CHAP鉴权、卷隔离LUN Masking)等;

 支持管理员的密码认证和权限分级;支持管理的安全机制(如SSH)。

总结

基于IP统一存储架构的共享灾备平台充分体现了“应用为先导,技术透明化”的IT发展趋势,是在开放性标准、模块化、互联互通基础上构建的划时代解决方案,使灾难备份系统建设突破了长期困扰管理者的兼容性、成本和管理性桎梏,成为广大行业用户均能轻松获得的最新存储服务


网友评论

登录后评论
0/500
评论
老牛的博客
+ 关注