云迁移过程如何避免停机

简介:

在公共云迁移过程中,IT团队需要采取一种一步一随的谨慎做法以避免发生可怕的“系统关闭”事件。

随着众多企业迁移至基于云的基础设施,IT团队需要确保在迁移过程中的可用性。但是考虑到所涉及的复杂性,在云迁移过程中防止或最小化停机时间并不容易。云团队需要考虑数据的不一致性、监控不同的软件版本并检查其网络连接是否成功。

如果企业的应用程序停用,那么其业务就会中断。虽然精确的指标因具体公司和应用而有所不同,但是Gartner在2014年发现,网络停机事件的平均成本为5,600美元/分钟。停机事件的高昂成本也是企业通常将他们最负责工作负载迁移至其他平台(包括云)的原因之一。

企业用户仍然以一个较快的速度扩大着公共云的应用范围。Forrester Research预测,2017年全球公共云市场将达到1460亿美元,高于2015年的870亿美元。

看不清的前景

对于选择迁移至云的企业来说,未来的前景是有好有坏的。任何的云迁移过程都是困难的。移动信息需要付出大量的时间与精力,即便生产系统与目标系统是完全兼容的。您的云供应商所运行系统与用户内部使用系统相同的可能性极小,所以云迁移挑战难度呈指数级增长。

在另一方面,如今的计算基础设施较以往更显模块化。

“虚拟化使企业更容易地实现不同系统之间的工作负载迁移,”Forrester Research的首席分析师兼基础设施即服务私有云负责人Lauren E. Nelson说。

虚拟化创建了一个抽象层,所以软件不再像过去那样那么的依赖于系统特性。应用程序也不再与操作系统紧密相连,而往往更依赖于哪些服务器资源可用。其缺点是现代工作负载通常是大而复杂的。大多数功能的实现都需要数亿行以上的代码。此外,其模块化设计则意味着它们能够与许多其他系统(例如用于身份管理的系统)进行交互。

从哪里开始云迁移过程

将用户所有的应用程序和支持基础设施一下子都迁移至公共云是不可行的。

“如果应用程序数量众多,那么迁移过程需要花上六至十八个月,” Nelson说。

将整个云迁移过程分解为可管理的若干步骤。从最小、最简单的项目开始,然后是更大更复杂的项目。在迁移过程中,并行运行内部部署和云计算系统、同步数据并测试云部署,以确保迁移过程中没有遗漏。另外,记录所有的API以便了解在云迁移过程中用户需要监控哪些API.

当企业用户将其原来的接口映射至新接口时,成功的关键在于细节。例如,一个应用程序可能运行4.0版的用户接口,而云供应商则使用4.1版,这就有可能包括一个应用程序不支持的功能并防止系统中运行过程中崩溃。

定制,网络面临迁移挑战

在云迁移过程中,区分企业服务或简化操作的定制应用程序会带来额外的挑战。当企业改写应用程序时,通常会创建一个附加组件或重写软件。如果云供应商缺乏支持独特功能所需的软件,那么这种定制就可能带来问题。

网络通信是与公共云相关的另一个重要因素。当企业用户将信息从内部迁移至场外时,他们需要确保其WAN链接的传输速度足够快以提供足够的性能。在某些情况下,这需要升级。

在将工作负载迁移至云时,企业会面临众多的挑战,但是公共云供应商们提供了相关的工具与服务以简化云迁移过程。

本文转自d1net(转载)

相关文章
|
1月前
|
SQL DataWorks 大数据
DataWorks常见问题之偶发比较频繁如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
34 4
|
5月前
|
存储 人工智能 缓存
[大厂实践] 无停机迁移大规模关键流量 (上)
[大厂实践] 无停机迁移大规模关键流量 (上)
58 0
|
7月前
|
弹性计算 网络安全 Apache
服务器迁移上云实验过程记录
本课程向您介绍了服务器迁移上云的基本概念,这些概念可以帮助您快速了解在企业服务器迁移上云的重要性和应用场景,同时本课程介绍了您可以采用的云上迁移工具、方法和可操作步骤,以帮助您了解企业是如何处理各类服务器迁移上云场景的。
|
19天前
|
弹性计算 网络安全 虚拟化
ECS数据问题之升级配置预防数据丢失如何解决
ECS(Elastic Compute Service,弹性计算服务)是云计算服务提供商提供的一种基础云服务,允许用户在云端获取和配置虚拟服务器。以下是ECS服务使用中的一些常见问题及其解答的合集:
|
5月前
|
存储 监控 安全
[大厂实践] 无停机迁移大规模关键流量 (下)
[大厂实践] 无停机迁移大规模关键流量 (下)
34 0
|
12月前
|
缓存 JSON 运维
如何避免大规模线上故障
如何避免大规模线上故障
107 0
|
JSON 运维 网络协议
平稳运行半年的系统宕机了,记录一次排错调优的全过程!
最近发生了一件很让人头疼的事情,已经上线半年且平稳运行半年系统在年后早高峰的使用时发生了濒临宕机的情况。访问速度特别慢,后台查到大量time_wait的连接,从代码层面到架构层面到网络层面排查了几天几夜,总算是有了结果。
|
存储 监控 搜索推荐