超融合超越企业传统存储绕不开的六个问题

  1. 云栖社区>
  2. 博客>
  3. 正文

超融合超越企业传统存储绕不开的六个问题

boxti 2017-08-09 15:10:00 浏览1003
展开阅读全文
 
 【51CTO.com原创稿件】 在虚拟化及云计算技术大规模应用于企业数据中心的科技浪潮中,存储性能无疑是决定企业核心应用是否能被虚拟化、云化的关键考量指标之一。传统的做法是升级存储设备,从低端、中端到高端存储,但这没解决根本问题,性能和容量仍不能兼顾,并且不能很好的解决异构设备利旧和架构扩展的问题。因此,企业需要一种大规模分布式存储管理软件,能够充分利用已有的硬件资源,在可控成本范围内提供最佳的存储性能,并能根据业务需求变化,从容量和性能两方面同时快速横向扩展。这也是当今软件定义存储兴起的现实基础。

超融合超越企业传统存储绕不开的六个问题

超融合架构(Hyperconvergence Infrastructure, 简称HCI)将虚拟化计算和存储整合到同一个系统平台,通过软件来统一管理。简单的说就是物理服务器上运行虚拟化软件(Hpyervisor),通过在虚拟化软件上运行分布式存储服务供虚拟机使用。分布式存储可以运行在虚拟化软件上的虚拟机里,也可以是与虚拟化软件整合的模块。广义上讲,除了虚拟化计算和存储,超融合架构还可以整合网络以及其他更多的平台和服务,为企业实现可扩展的 IT 基础架构。

历史经验一再表明,由技术进步推动的变革往往以超乎人们想象的速度和烈度发生着。面对新的变革和潮流,在追逐新技术潮流变化的同时,我们还需冷静思考可能带来的问题。在企业级数据中心,如何正确认识超融合和传统存储?如何能提高性能和降低成本,并可控风险?这些都需要我们从实际出发,辩证和客观的去看待。

问题一、企业传统存储与超融合差别在哪里?

企业传统存储架构最大的问题有如下几个方面:1.存储资源集中化,很难随着计算资源扩展而扩展,无法适应数据中心的这种可灵活扩展的需求。2.采用存储与计算分离的这种架构,需要独立的网络、独立的存储与独立的计算。为了提高系统可用性,需要通过资源冗余的方式达到设计目标。因此,网络、存储控制器(双控或多控)都会进行多份冗余,增加了数据中心的投资。3.多种不同的存储系统在数据中心中进行部署无疑增加了数据中心的管理复杂度。尤其是后端多种类型的存储设备,增加了数据中心的管理成本。

采用超融合架构,它明显的优点是易于扩展,最小部署,按需扩容。具体表现在:1.完全软件定义。独立于硬件,采用商业通用标准硬件平台(如X86),完全采用软件实现计算、存储、网络等功能。2.实现统一管理。以虚拟化计算为中心,计算、存储、网络均由虚拟化引擎统一管理和调度,软件定义屏蔽了以往异构设备的复杂性。3.完全分布式,去中心化。横向扩展的分布式系统,计算、存储、网络按需进行动态扩展,系统不存在任意单点故障,采用分布式存储可实现去中心化。

问题二、传统存储与超融合分布式在数据一致性方面的区别

数据一致性是指关联数据之间的逻辑关系是否正确和完整,可以理解为应用程序运行的数据状态与最终写入到磁盘中的数据状态是否一致。在企业核心应用高并发业务场景下,数据一致性的保障可大大提高系统的可靠性和容错性。引起数据一致性问题的一个主要原因是位于数据I/O路径上的各种Cache或Buffer(包括数据库Cache、文件系统Cache、存储控制器 Cache、磁盘Cache等)。由于不同系统模块处理数据IO的速度是存在差异的,所以就需要添加Cache来缓存IO操作,适配不同模块的处理速度。这些Cache在提高系统处理性能的同时,也可能会“滞留”IO操作,带来一些负面影响。如果在系统发生故障时,仍有部分IO“滞留”在IO操作中,真正写到磁盘中的数据就会少于应用程序实际写出的数据,造成数据的不一致。当系统恢复时,直接从硬盘中读出的数据可能存在逻辑错误,导致应用无法启动。

首先从缓存管理上看,传统存储和超融合的分布式缓存管理是不一样的。首先,传统存储是集中式缓存一致性管理。在这种缓存管理模式下,集群中所有节点均不维护本地缓存,而是所有节点共享访问一个集中存放的缓存,数据在缓存中只有一份副本,不会也不可以出现多份副本。该缓存管理架构的优点是天然的缓存一致性,因为不存在多个副本,不需要特殊过程来维护缓存一致性。对于高端存储系统而言,该设计的劣势是缓存需要集中放置,需要使用某种外部网络来连接集中的缓存,而且提供异步化的类似IO的访问方式,编程复杂,难以掌控和优化,需要投入大量成本。

而超融合分布式的缓存管理则是集群中的每个节点都有自己独享的缓存,这种情况会给缓存一致性管理上带来极大的复杂性,当然,所获得的收益便是一旦命中则性能会非常好。所谓对称式指的是集群中所有节点在缓存管理的地位上是均等的,都可以自行控制管理各自的缓存。所谓任意关联,则是指任意节点均可以缓存任意数据块,数据块大小视不同产品设计灵活而定。因为可以任意缓存,所以会导致多个集群节点同时缓存有同一个数据块的多个不同版本的副本,从而导致一致性问题。解决的办法则是效仿多CPU缓存一致性管理方面的思路,采用MESI一致性基本协议及其变种,可以在尽量减少广播通信的前提下实现任意关联分布式缓存一致性。该设计的优点是可以充分利用缓存空间,劣势是成本高,因为需要一个低时延的网络来实现MESI协议流量,否则性能将很差;另外,需要一个高速搜索算法来搜索对应目标数据块在缓存中的位置,必要时引入硬加速比如TCAM等,导致成本再次增加。

还有就是分布式的系统常常受制于CAP定律。CAP定律说的是在一个分布式计算机系统中,一致性、可用性和分区容错性这三种保证无法同时得到满足,最多满足两个。众所周知,分布式事务一般采用两阶段提交策略来实现,这是一个非常耗时的复杂过程,会严重影响系统效率,在实践中我们尽量避免使用它。在实践过程中,如果我们为了扩展数据容量将数据分布式存储,而事务的要求又完全不能降低。那么,系统的可用性一定会大大降低,在现实中,我们一般都采用对这些数据不分散存储的策略。

从以上分析来看,传统存储与超融合分布式的数据一致性还是有明显区别的,在具体业务场景中,需要综合成本、性能、稳定性方面来综合考量和选择。

问题三、企业级数据服务的高级功能

目前,在大多数超融合系统和SDS系统都具备了核心的企业级功能,包括数据冗余、自动精简配置、快照、克隆、SSD Cache/Tier、数据自动重建、高可用/多路径等数据功能,但有些高级功能例如重复数据删除、数据加密、数据压缩等还是缺失的。相对于高端存储系统,如果超融合架构要承载核心关键应用,还有一些差距,包括但不限于QoS控制、数据保护、数据迁移、备份容灾、一致性的高性能。核心存储系统应该遵循RAS-P原则,先做好稳定可靠性,其次是企业数据功能完备性,最后才是高性能,这个顺序不能乱,光有高性能是不行的。

目前超融合架构中,许多两副本和三副本的解决方案也是在同一个数据中心内或同一POD里,跨数据中心的容灾几乎没有。还有就是存储双活和仲裁,目前VSAN支持存储双活,还引入了WITNESS组件。但其他超融合解决方案还没有支持应用双活的案例。

对于超融合来说,如果缺少完整可靠的数据服务能力则意味着采用这个解决方案的客户仍然需要购买额外的存储系统来填补原有解决方案所缺少的功能。

目前,核心关键业务系统还不太敢往超融合架构上迁移,主要还是从非核心业务开始检验,毕竟超融合出现时间还比较短,需要更多的时间做实践验证。但是,我们有理由相信未来超融合必定是可以支持核心关键业务的主流架构。

问题四、如何进行数据生命周期管理

随着企业业务发展以及各种平台、系统的建立,这意味着需要管理的数据量越来越庞大,资源维护成本越来越高,效率越来越低。那么,面对企业对数据的不同时效、不同访问频率、不同重要性等要求,如何降低数据存储和使用维护成本,对不同数据进行生命周期管理是非常有必要的。

结合业界的相关标准规范,企业需要对IT系统的数据进行必要的归类。目前,根据系统的业务特点,比较流行的数据归类包括:生产交易型数据、服务支撑型数据与系统日常数据三部分。

根据数据归类,不同类别的数据应匹配不同的数据存储策略。数据存储策略就是将不同的数据存放在指定的存储设备上。目前,主要的存储设备主要分成在线存储、近线存储、离线归档存储这三种常用存储。

在传统企业存储中,通过分级存储策略,根据数据不同的重要性、访问频次等指标把数据分别存储在不同性能的存储设备上,并采取不同的存储方式。这样一方面可以大大减少非重要性数据在一级本地磁盘所占用的空间,还可加快整个系统的存储性能。

对于超融合分布式存储来说,目前还未充分考虑到数据生命周期的管理,对于冷热数据虽然也有存储区域上的区分,但基本都是拿闪盘来做缓存加速,还不能有效做到分级存储,来满足企业对于大量不同数据的精细化管理和生命周期管理。

问题五、企业传统存储与超融合是对立还是共存互补?

传统企业的IT一般都经过了若干年的发展,形成了自己特有的基础架构和硬件设施。企业采购的服务器、存储等IT资源都是固定资产,往往希望将淘汰或过保的这些资源进行利旧,从而达到保护投资的目的。而且在企业中,还有相当一部分的传统IT应用仍然运行在物理服务器和传统存储系统之上。我们可以乐观地认为没有哪一种应用程序不能被部署在超融合基础架构上,但是考虑到运行效率、硬件依赖性以及和虚拟化环境兼容性等因素,很多IT应用最好还是继续保持运行在物理硬件架构,比如关键数据库应用、实时控制系统以及大量遗留IT系统。当然许多业务场景,需要灵活的扩展性和弹性配置,也非常适合超融合的架构,我们也会根据需求来决定是否采用超融合解决方案。

大多数的超融合解决方案都希望数据中心可以“完全投入”,即用超融合解决方案自带的基础架构和流程替换数据中心现有的存储硬件、基础架构和流程。他们通常希望数据中心摒弃共享式集中存储硬件,而支持商业化的超融合架构。这种想法有点激进,容易让超融合站在传统存储的对立面,而又不能解决实际的问题。企业级数据中心的演变一定是一个渐变的过程,所以企业传统存储与超融合不是对立的关系,而是共存和互补的关系,只有面对企业现实场景和具体问题,各自发挥自己的优势和特长,解决问题才是达到真正的和谐与共赢。

问题六、与同类厂商比,缺少合理的计价模式

超融合解决方案大部分按照容量包获得许可。许多软件还针对高级功能收取额外费用。这就造成了一个问题,因为大部分数据中心从来都不能确定自己合适的容量限点来充分利用容量打包价格的优势。例如,一个初级容量包可提供5-10TB的存储服务,更高一级的容量包则支持10-25TB。如果企业需要12TB存储容量怎么办?这就意味着企业为了支持多出的2TB的容量,必须升级到25TB的容量许可。其实根据容量来算多少钱,这个方法并不公平。如果按能提供多少个IOPS来算钱?这个才比较公平。这两种方法实际上有差别,第一个,全闪存这个性价比非常的高。但是,这个价格也比较高,是混合型的3倍,很多用户接受不了这样高的价值。很多用户还是希望容量和性能的匹配。

另外大部分超融合解决方案都会忽视的另一项成本是:不支持现有基础架构和存储系统所产生的相关成本。这样在实现异构统一管理的过程中,还需开发相应的接口和API,这些隐形成本也是一笔不小的开支。

基于超融合未来良好的发展前景,各厂商也纷纷推出了超融合一体机产品。这种一体机很明显的优势就是降低了成本,简化了部署,提高了可用性,加快了业务上线时间,但也有扩展性和兼容性方面的一些问题。因此,还需结合企业特点做深度定制并针对不同的业务场景进行性能优化,充分利用它的计算、存储、网络融合的硬件架构优势和分布式存储高吞吐、高IOPS的特点,进一步整合高速网卡、SSD闪存等硬件的优异性能,从而使得产品整体性能相比业界同类平台得以大幅提升,满足不同行业的需求才更有市场。

超融合的未来

随着云服务的崛起,比较精准的VM管理、系统级QoS,数据分析和挖掘都是未来的增值重点。未来5-10年,新一代数据中心基础架构会朝着软件定义和超融合方向发展,SAN/NAS存储逐渐被软件定义的存储所替代,超融合架构将成为数据中心基础架构的核心。虽然现阶段超融合还有许多问题,但是不妨碍它的优秀。同时,我们看到超融合是一个不断演进的架构,是一个充满生机和活力的商业模式,未来潜在的市场空间巨大,在未来也会发展的更好!

 
 作者:孙杰
来源:51CTO

网友评论

登录后评论
0/500
评论
boxti
+ 关注