自动精简配置&重复数据删除核心技术点及其经济效应探究

简介:
  在当前日益汹涌的金融危机逐渐影响实体经济的情况下,企业面临存储扩容需求时不得不精打细算,为了降低最终拥有成本(TOC),除了减少初次采购成本,也希望尽可能减少企业今后的运营维护成本。重复数据删除技术作为时下最热门的存储优化技术,能显著降低存储设备物理介质消耗,并减少数据中心对空调,空间,和灾备的消耗,还可以与本文涉及的自动精简技术无缝配合,极大降低存储系统的维护管理成本,显著提高企业存储系统的利用率,实为抵御当前经济危机的又一利器。

首先介绍存储系统的自动精简配置(Thin Provisioning)技术。自动精简配置技术扩展了存储管理功能,虽然实际分配的物理容量小,但可以为操作系统提供超大容量的虚拟存储空间。随着应用写入的数据越来越多,实际存储空间也可以及时扩展,而无须手动扩展。换句话说,自动精简配置提供的是“运行时空间”,可以显著减少已分配但是未使用的存储空间。

如下左图所示为使用传统配置方式创建了3个卷。整个存储系统有2TB的可用存储空间。卷1的大小是500GB,其中有100GB实际数据,另外400GB是已经分配但是未使用的空间。卷2的大小是800GB,其中200GB实际数据,另外600GB为已分配但未使用的空间。卷3的大小是550GB,其中50GB实际数据,另外500GB为已分配但未使用的空间。整个存储系统有350GB的实际数据,1.5TB已分配但未使用的空间,并最后剩下150GB可用空间给其他应用。

同样的2TB存储系统采用自动精简配置技术之后,结果较传统方法有显著差异。系统管理员同样创建这3个卷,使用自动精简配置之后,由于存储空间是在数据写入过程中动态申请分配的,因此就不存在已分配但未使用的空间。所以采用自动精简配置之后整个存储系统里同样有350GB数据,但有1.65TB可用空间。相对于使用传统配置方式时的150GB,采用自动精简配置使得可用空间增加了11倍!

 
由此可以看出,采用自动精简配置可以把存储空间的利用率提高到近乎100%。

另外自动精简配置不仅可以提高存储空间的利用率,降低IT人员进行存储管理的复杂度,还可以极大减少存储系统扩容的规模,增加现有存储系统支持的应用服务器的数量。

 

以下对自动精简配置的优点进行简单的总结:

l  用户可以创建更多的卷,单个卷的空间可以更大,并可以动态地管理各个卷的大小。
l  用户可以在初次购买更少的存储介质,并在随后按需增加磁盘容量。
l  在创建卷时不需要进行深入的容量规划,减少IT管理人员存储配置的工作量,避免预估不当造成的存储空间浪费。或者存储空间不够导致后续中断业务以进行扩容升级。
l  存储介质的空间利用率显著提高,相应地在同样的存储空间下可以支持更多的应用服务器,提升存储系统的利用率。

存储介质的空间利用率显著提高,相应地在同样的存储空间下可以支持更多的应用服务器,提升存储系统的利用率。

重复数据删除(De-duplication)技术,主要是对存储数据流以一定的目标尺寸进行指纹校验,对于其中重复出现的数据单元,在实际写入存储介质时,只需记录相应的指纹记录位置即可,因此可以极大降低存储介质消耗。“去重率”这个参数就是用来定义重复数据删除中的优化率,它等于原数据大小除以去重之后的数据大小,实际去重率随去重模块部署在存储系统的位置以及数据的重复率有较大差异。对于次级备份数据,一般的去重率在10~20:1之间。另外还可以配合硬件压缩,像Hifn公司的DR系列硬件加速无损压缩板卡,可以在不影响备份设备性能的前提下取得2:1的压缩比。这样两者结合,可以实现20~40:1的数据缩减比。

当前重复数据删除主要被用于次级备份业务,一般和虚拟磁带库(VTL)处在同一位置。如果说IP-SAN市场的崛起是源于对链路要求从FC到IP的降级,那么支持重复数据删除的IP-SAN设备会更加加速这样的趋势。因为经过重复数据删除和压缩处理之后,应用产生的数据被大量缩减,使得之前利用FC构建的主存储和次级存储之间的链路的负担显著减轻,从而完全可以被更经济的IP链路所取代。

2009年,自动精简配置和重复数据删除这两种技术可以显著提升存储介质的利用率,进而提升存储系统的利用率,减小企业IT运营成本,降低管理成本,有利于企业在经济发展面临困境时顺利过冬。


 


来源:51CTO
目录
相关文章
|
8月前
透过现象看创本质的能力-从忒休斯之船到系统论
透过现象看创本质的能力-从忒休斯之船到系统论
|
19天前
|
存储 缓存 监控
【分布式技术专题】「缓存解决方案」一文带领你好好认识一下企业级别的缓存技术解决方案的运作原理和开发实战(场景问题分析+性能影响因素)
【分布式技术专题】「缓存解决方案」一文带领你好好认识一下企业级别的缓存技术解决方案的运作原理和开发实战(场景问题分析+性能影响因素)
32 0
|
10月前
|
算法 计算机视觉
图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响
图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响
|
12月前
|
负载均衡 监控 安全
网关系统就该这么设计,万能通用,稳的一批!
网关系统就该这么设计,万能通用,稳的一批!
|
12月前
|
负载均衡 监控 安全
网关系统就该这么设计(万能通用),稳的一批!
网关系统就该这么设计(万能通用),稳的一批!
|
12月前
|
XML Java 数据库连接
工作几年了,原来我只用了数据校验的皮毛~
前言 什么是 JSR-303? 添加依赖 内嵌的注解有哪些? 如何使用? 简单校验 分组校验 嵌套校验 如何接收校验结果? BindingResult 接收 全局异常捕捉 spring-boot-starter-validation做了什么? 如何自定义校验? 自定义校验注解 自定义校验器 演示 总结
|
人工智能 算法 搜索推荐
颠覆传统RPA的实在IPA模式,如何做到真正人人可用
为什么实在智能能够率先发布一款颠覆传统RPA的IPA模式产品?CEO孙林君告诉我们答案。
149 0
颠覆传统RPA的实在IPA模式,如何做到真正人人可用
|
SQL 存储 测试技术
|
人工智能 数据可视化 数据挖掘
后疫情时代,用数据支持业务恢复创造新的可能性
2020年可以说每一天都在见证历史,新冠疫情的突然造访就如同“黑天鹅”不期而至,而企业现在还不开始数字化转型就如同“灰犀牛”存在潜在风险,当下在黑天鹅和灰犀牛的夹击下,经济和市场都产生了巨大的影响。
|
存储 弹性计算 5G
5G 网络重构关键技术 | 带你读《5G时代的承载网》之十五
5G 网络架构的重构是以一系列新技术的引入作为先决条件的,例如,基于 SDN 实现控制与转发的分离,基于 NFV 实现软硬件解耦。另外,还需要引入 网络切片、边缘计算、D2D 通信等技术方向,以形成针对所有场景的解决方案。 本节将对几个主要的 5G 使用技术做简单介绍。
5G 网络重构关键技术  | 带你读《5G时代的承载网》之十五