磁盘阵列故障数据恢复常规思路--谈数据恢复心得

简介: 在服务器磁盘阵列出现故障以后,一般情况下会采用两种方法来处理:一是设备厂家对故障设备进行处理及恢复,比如更换坏件、重配Raid等;二是找专业的数据恢复公司来处理,先把重要数据恢复出来,然后才进行硬件设备维修。

在服务器磁盘阵列出现故障以后,一般情况下会采用两种方法来处理:一是设备厂家对故障设备进行处理及恢复,比如更换坏件、重配Raid等;二是找专业的数据恢复公司来处理,先把重要数据恢复出来,然后才进行硬件设备维修。

有个数据恢复案例硬件信息及故障如下:
由14块盘做成的HP阵列柜,其中13块盘做成Raid5,有1块硬盘是热备。14块盘的硬盘指示灯均显示绿灯正常,在操作系统中的磁盘管理界面能看到阵列盘,但都显示为不可识别的硬盘。本案例故障属于磁盘阵列(Raid)信息故障。磁盘阵列信息存储在HP阵列卡上,同时还在每个物理硬盘上存有备份。如果这两个信息不一致,或者其中一个损坏,就会出现本故障现象。
        
恢复方案:
        方案1:重新配置或者修复Raid信息。这种方式方便快速,先查看现有阵列信息参数(磁盘顺序、块大小等),在原阵列卡上删除现有Raid信息,重新创建Raid5,配置的时候保留原有的Raid5参数。这种做法需要深入了解Raid卡,要知道阵列卡的每一个工作细节,特别注意该阵列卡在重新配置阵列的时候是否自动初始化阵列,是否破坏原有数据等等。所以这个方案具有一定的风险,但是这种恢复方式速度快,在特定情况下,需要论证该方案的可行性,如果可行就可以采用。
        
       方案2:重新组合磁盘阵列上的数据到新的磁盘阵列上。本案例阵列卡安装在服务器上而不是在阵列柜中,我们把这个HP阵列柜挂接到一个带有SCSI接口的机器上,就能识别出14块独立的物理硬盘,这个操作不会对硬盘有任何的数据破坏。从14块独立的硬盘中分析出Raid5的数据组合方式(块大小、数据走向、硬盘顺序等),得出详细的组合参数以后,用“护航舰”Raid重组工具把Raid5的数据组合到新的磁盘阵列柜。本案例中单个物理硬盘容量300GB,总的磁盘阵列柜容量为4TB左右,重组数据需要花费比较长的时间,重组过程需要花费24-36小时的时间或者更长一些。本恢复方案没有数据破坏和丢失的风险,因为对原有的物理硬盘只进行读操作,但是花费的时间就长一些。

在实际恢复工程中,我们建议采用第2种方案进行数据恢复,在物理硬盘没有硬件损伤(硬盘不可识别)的情况下,方案2保证了数据100%的安全,也保证100%的恢复。方案1是在特殊条件下才能采用的,不能保证数据100%安全。

声明:作者达思数据恢复技术专家覃廷良,本文首发http://www.bnuol.com ,在donews.com,51cto,techweb,新浪,百度等数据恢复技术博客上转发.欢迎转发,转发请保留作者及出处。

目录
相关文章
|
6月前
|
数据挖掘
服务器数据恢复-服务器raid0数据恢复案例
服务器故障&分析: 某公司一台服务器,共2块磁盘组建了一组raid0磁盘阵列。RAID0阵列中有1块硬盘出现故障离线,导致服务器崩溃。 通过和用户方的沟通,北亚企安数据恢复工程师初步判断:故障服务器中出现故障离线的硬盘在出厂时存在物理缺陷,经过长时间的运行后,这块硬盘非正常老化,加上外力磕碰等情况导致磁头损坏,硬盘掉线。 服务器采用的是raid0磁盘阵列,一块硬盘掉线就会导致服务器崩溃。要恢复服务器数据,物理修复掉线硬盘是关键。
|
3月前
|
存储 关系型数据库 MySQL
【服务器数据恢复】同友存储数raid5崩溃的据恢复案例
服务器数据恢复环境: 一台同友存储,存储上有一组raid5磁盘阵列,存储上层有若干台虚拟机,其中有3台linux操作系统虚拟机上存放重要数据。 服务器故障: 同友存储上的raid5阵列崩溃导致存储无法启动。
【服务器数据恢复】同友存储数raid5崩溃的据恢复案例
|
6天前
|
存储 数据库
服务器数据恢复—服务器RAID5故障数据恢复解析
RAID5作为应用最广泛的raid阵列级别之一,在不同型号服务器中的RAID5出现故障后,处理方法也不同。 RAID5阵列级别是无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存取技术,能在同一磁盘上并行处理多个访问请求,同时允许阵列中的任何一个硬盘出现故障。 实际案例中,raid5阵列最常出现的故障情况就是硬盘自行脱机,联机状态显示为DDD(Defunct Disk Drive,无效磁盘驱动器),硬盘出现物理故障或逻辑故障。
服务器数据恢复—服务器RAID5故障数据恢复解析
|
29天前
|
存储 数据挖掘 Windows
服务器数据恢复—异常断电导致raid信息丢失的数据恢复案例
由于机房多次断电导致一台服务器中raid阵列信息丢失。该阵列中存放的是文档,上层安装的是Windows server操作系统,没有配置ups。 因为服务器异常断电重启后,raid阵列可以正常使用,所以未引起管理员的注意。后续出现的多次异常断电导致raid报错,服务器无法找到存储设备,进入raid管理模块进行任何操作都会导致操作系统死机。管理员尝试多次重启服务器,故障依旧。
|
2月前
|
存储 运维 数据挖掘
【服务器数据恢复】断电导致服务器RAID故障的数据恢复案例
某品牌服务器中有一组由数块SAS硬盘组建的RAID5磁盘阵列,服务器操作系统是WINDOWS SERVER,服务器中存放企业数据,无数据库文件。 服务器出故障之前出现过几次意外断电的情况,服务器断电重启后没有发现异常,直到最后一次断电重启后RAID报错:“无法找到存储设备”,进入RAID管理模块后进行任何操作都会死机,服务器管理员多次重启服务器仍然无法进入系统。为了防止服务器内数据丢失,管理员联系我们数据恢复中心寻求帮助。
|
3月前
|
存储 运维 数据挖掘
服务器数据恢复—服务器进水,磁盘损坏的数据恢复案例
服务器数据恢复环境: 数台服务器+数台存储阵列柜,共上百块硬盘,划分了数十组lun。 服务器故障&检测: 外部因素导致服务器进水,进水服务器中一组阵列内的所有硬盘同时掉线。 北亚数据恢复工程师到达现场后发现机房内有一台存储柜中的机器都没有开机。和用户方沟通后得知:机房天花板渗水导致这台存储柜中最上方的两台服务器进水,其中一台服务器经过检修后可以正常工作,但是最上方的那台服务器则完全损坏。
服务器数据恢复—服务器进水,磁盘损坏的数据恢复案例
|
3月前
|
数据挖掘 数据库 Windows
【服务器数据恢复】服务器raid5崩溃导致上层分区无法访问的数据恢复案例
服务器数据恢复环境: 北京某教育机构一台服务器中有一组由3块磁盘组建的raid5阵列,服务器安装的windows server操作系统。 服务器故障: 该服务器在运行过程中突然瘫痪,无法正常工作。北亚企安数据恢复工程师去现场对故障服务器进行了检测,发现故障服务器raid5阵列中有一块硬盘由于未知原因离线,服务器中存放重要数据的分区无法识别。
|
4月前
|
运维 Oracle 关系型数据库
服务器数据恢复-raid5故障导致上层oracle数据库故障的数据恢复案例
服务器数据恢复环境: 一台服务器中有一组由24块FC硬盘组建的raid5磁盘阵列,linux操作系统+ext3文件系统,服务器上层部署有oracle数据库。 服务器故障&检测: raid5阵列中有两块硬盘出现故障掉线,导致服务器上层卷无法挂载,oracle数据库无法正常使用。 通过管理后台查看服务器中硬盘的状态,显示有两块硬盘处于离线状态。
|
4月前
|
运维 数据挖掘
服务器数据恢复—Raid5重建导致原raid阵列数据丢失的数据恢复案例
服务器数据恢复环境: 一台服务器上搭建了一组由5块硬盘组建的raid5阵列,服务器上层存放单位重要数据,无备份文件。 服务器故障&分析: 服务器上raid5有一块硬盘掉线,外聘运维人员在没有了解服务器具体情况下,将服务器上raid5阵列中4块正常硬盘(除去掉线的那块磁盘)重建为一组新的raid5阵列,导致服务器中的原始数据全部丢失。
|
4月前
|
存储 数据挖掘 Windows
服务器数据恢复—V7000存储raid5数据恢复案例
服务器数据恢复环境: 某品牌V7000存储中有一组由几十块硬盘组建的raid5阵列。上层操作系统为windows server,NTFS分区。 服务器故障: 有一块硬盘出现故障离线,热备盘自动上线替换离线硬盘。在热备盘上线同步数据的过程,与离线盘同一组Mdisk中又有另一块磁盘出现故障离线。热备盘同步失败,该组Mdisk失效,通用卷无法使用。