灾难恢复应避免三大错误-阿里云开发者社区

灾难恢复应避免三大错误

2017-08-09 1365

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

IT停机的代价是昂贵的，但一些组织却没有对如何处理灾难做好充分准备。

考虑到IT停机的高成本，灾难恢复规划对于每个企业都至关重要。根据HIS公司在2016年做出调查报告，北美地区企业每年的IT停机时间损失高达7000亿美元。对于一个典型的中型公司，平均将损失约为100万美元，而大型企业平均损失超过6000万美元。

然而，即使成本如此之高，当涉及灾难恢复计划以减轻服务中断的影响时，很多企业可能陷入常见的陷阱。VMware公司高级技术营销经理GSKhalsa说，他认为有三大错误，很多组织一犯再犯。

1.没有灾难恢复计划

Khalsa认为，到目前为止，一些组织所犯的最大错误，也是最常见的错误之一，就是没有任何类型的灾难恢复计划。他说，根据行业统计数据表明，多达50%的组织没有制定任何灾难恢复计划。

这是不幸的，因为对于灾难准备并不像大多数组织假设的那样复杂或昂贵。“它不必涉及购买任何设备。”Khalsa说，“它不需要涉及任何东西，只是进行组织业务的讨论，这就是灾难恢复计划。”

即使组织决定只从最近的夜间备份中进行恢复，他们至少应该写出这个计划，以便他们知道紧急情况下应该做什么，以及预期是什么，他补充道。

2.没有进行灾难恢复计划的测试

制定计划只是第一步。组织也需要一种方法来测试计划。Khalsa表示，不幸的是，在传统的非虚拟化数据中心中，没有一种简单的不中断的方式来进行恢复测试。因此，大多数公司的测试只是偶尔进行的。

他指出，拥有一个虚拟化环境便于测试。组织可以复制其虚拟机并在隔离的网络上测试其恢复过程。这样，他们可以了解其恢复需要多长时间，并发现潜在的问题，而不必中断正在进行的操作。

3.不理解灾难恢复的复杂性

组织有时低估了从备份中恢复所需的工作量。Khalsa解释说，一些组织希望能够通过人工进行恢复，而这实际上是不可行的，一旦有大约10或20个虚拟机时，采用人工方法将会事倍功半。

他指出，有时IT人员会编写自己的脚本代码来实现自动化恢复过程，但即使这样也会有问题。“人们忘记了灾难不仅仅影响系统，也可能影响工作人员。”Khalsa说。灾难发生后，撰写脚本的人可能当时并没有在场，这将会妨碍灾难恢复过程。

Khalsa为参与灾难恢复计划的组织提供的建议是让IT部门与业务部门进行更好的沟通。工作人员和管理人员需要了解恢复点目标(RPO)和恢复时间目标(RTO)选项，并对可接受的风险级别做出一些决定。

作者：佚名

来源：51CTO

灾难恢复应避免三大错误