做好灾备,为你的数据中心留条后路

简介:

很多企业都在考虑一个问题,就是如何创建一个灵活的、有弹性的数据中心。这其中包括确保计算机系统和其他重要设备的有序恢复,保证所有供电系统的正常运转等等。为实现这一目标,我们需要一个完善的灾难恢复规划。

111

假设你希望数据中心的恢复规划良好,你必须将数据中心看做业务流程,其中有大量相互依赖且变化的部分。并且,由于其中有大量相互关联的部分,当意外发生时,所有要做的事情必须预先用流程的形式写在文档上。如果数据中心管理员对灾备毫无概念,这将是非常危险的事情。当所有事情都出了问题后,每个人都会将矛头直指该数据中心管理员。

一整套体系架构和相关应用程序的流程首先是必须的。每个部件,或每个部件组通常有支持的体系架构,并且通常来讲,都有一个或一组人对其负责。因此服务器会分到服务器组中,或虚拟组中,也有可能两个都是。所有这些通常在一个体系架构组或一个运营组下面,然而当遇到重大事故时,这些都会呈现星状图拓展开来,和各容灾管理员直接对应。谁负责,谁决策,需要做什么,以及所做的顺序,这类管理模型必须清晰地记录下来。

在整个容灾规划中,每个功能模块必须明确其角色,负责范围,以及时间点和所需执行的流程步骤。在数据中心中,所有的资源被完全保护并具备冗余。到一定程度后我们会惊奇地发现绝大多数数据中心中充斥着单点故障,这是我们必须考虑解决的。

另外,电源UPS风险也要充分考虑到。当然,还有一部分风险在于不间断电源是否可以支撑到发电机启动并接受所有这些麻烦。而且,让供应商参与到实际测试中还是十分必要的。也可以通过电力公司参与测试。不过对于不间断电源这种孤立的设备,是非常重要的……但你要从端到端考虑。不仅是不间断电源,还有不间断电源的不间断电源,以及发电机,导线和电源分配器,并且按步骤从不论是变电站或发电机获取电量。很多事可以,也应该作为预防维护事件进行。每年或每半年你应该进行负载测试;你应该做预防性的监测;你应该进行红外线测试来检测电线是否老化……所有这些都是一个整体。

总之,在进行数据中心容灾规划时要考虑到从主体设备到辅助硬件的方方面面。任何一个层面出了问题都可能影响业务连续性运行。


作者:何妍 

来源:51CTO

相关文章
|
5天前
|
存储 容灾 关系型数据库
企业上云的灾备规划与分析
【4月更文挑战第21天】在数据分析方面,数据被分为系统、基础、应用和临时数据四类,以及数据库和非数据库、孤立和遗失数据四种存储管理方式。业务分析中,业务系统被划分为关键、重要和一般三类,强调了不同类型业务中断的影响程度。在灾备技术分析中,介绍了离线式(冷容灾)和在线式(热容灾)容灾技术,包括备份软件和数据复制的三种层次:基于存储、主机和数据库。
|
1月前
|
存储 网络协议 中间件
双活数据中心建设要点
【2月更文挑战第26天】
|
11月前
|
运维 NoSQL 容器
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.3 故障快恢
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.3 故障快恢
142 0
|
11月前
|
运维 监控 中间件
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.1故障发现
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.1故障发现
130 0
|
11月前
|
运维 监控
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.2故障应急
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.3.2故障应急
198 0
|
存储 容灾 数据挖掘
阿里云“两地三中心”,中小企业都用得起的多保险灾备方案
阿里云框架下的创新——惠普“两地三中心”
阿里云“两地三中心”,中小企业都用得起的多保险灾备方案
|
存储 监控 安全
IT解决方案如何为网络基础设施做好应对灾难的准备
企业需要制定灾难恢复计划,以确保员工的健康和安全并减少或限制停机时间,以便无论发生什么样的灾难都能继续正常运行业务,关键是积极主动性。以下是7条必要的IT解决方案建议,以确保企业基础设施的网络和技术能够抵御任何灾难。
159 0
|
存储 运维 监控
技本功|数据安全之IDC数据容灾设计实现
近年来,数据安全问题日渐受到大家的关注,对于任何一家企业,数据无疑是最重要的资产之一。提到数据容灾,大家可能会想到备库和备份的概念,那么我们先来谈谈**备库与备份**的区别。
307 0
技本功|数据安全之IDC数据容灾设计实现
Uma
|
存储 容灾 BI
灾备重于一切 别让数据成为企业之殇
在数据就是企业生命的时代,一家互联网创业公司的平台数据全部丢失,就等于收到了病危通知书。云服务商的故障直接导致公司业务停运,多年积累毁于一旦,造成的经济损失以及对品牌的负面影响不可估量。
Uma
1744 0