Hyper-V损坏数据恢复报告

简介:

 一、故障概述

1、故障环境

  故障环境为Windows Server 2012服务器,系统中部署了Hyper-V虚拟机环境,虚拟机的硬盘文件和配置文件放在DELL MD3200存储中(注:硬盘600G*4,4T*1)。MD3200存储是由4块600G硬盘组成的阵列,用作存储虚拟机的数据文件。单块4T硬盘用作虚拟机数据文件的备份。

2、故障分析

  由于MD3200存储中虚拟机的数据文件丢失,导致整个Hyper-V服务瘫痪,虚拟机无法使用。因此要以如下流程进行数据检测:

  1、对MD3200存储服务器进行物理检测,发现存储并未出现物理故障,涉事硬盘均正常工作。

  2、检查操作系统:工作正常中,未发现出错进程,排除因操作系统BUG导致的数据丢失。

  3、分析丢失数据硬盘的文件系统:打开正常,不符合病毒破坏的表现特征,同时经杀毒软件检测无病毒。再仔细分析硬盘的文件系统,发现此文件系统的源文件创建时间为11月28日,表明文件系统的创建时间为11月28日,与数据丢失的时间相吻合。通常这种故障表明:文件系统被人为重写了,即分区被格式化了。

  4、检查系统日志:发现系统日志11月28号之前以及当天的系统日志已被清空,审核日志和服务日志却并未清空。通常情况下,此操作应该由人为导致。而格式化分区的操作只记录在系统日志中,这与上述人为破坏的表现相符。

  5、尝试恢复系统日志:仔细分析硬盘底层数据,发现硬盘底层中需要恢复的系统日志已被新的日志记录覆盖,无法恢复。

  6、分析操作系统中的所有分区:发现只有MD3200存储中的两个分区的文件系统被重新写入文件系统了。通常情况下,对两个分区的格式化需要有两个独立的过程,因此这种针对性的操作应该由人为导致。

3、导致故障的常见途径

  1、通过在分区上“右键”,选择“格式化”按钮,可以格式化选中的分区。

  2、在开始菜单“运行”中输入“cmd”命令进入到命令行模式,然后使用FORMAT命令,可以格式化指定分区。

  3、创建一个bat文件,在文件中写入格式化的命令,然后运行bat文件可以格式化指定分区。

  4、因为有两个独立的文件系统数据丢失,故上述的流程可能被执行了多次。应该因人为操作导致。

二、解决方案概述

  根据前期的故障分析结果,总结出以下解决方案:

  1、备份用户数据,对丢失数据的硬盘,做全盘备份,以确保数据的安全性。

  2、分析每个硬盘的数据,根据分析的结构重组RAID 阵列。

  3、分析重组完的阵列,看能否找到原有的文件索引项及对应的数据区。

  4、核对查到的文件索引项是否符合用户数据,并核对相应的数据区有无破坏。

  5、根据扫描到的文件索引项碎片,将其拼接成一个完整的目录结构。

  6、根据拼接好的目录项去底层恢复对应的数据,并检查数据是否正确。

  7、核对数据没问题后恢复所有数据。

三、实施解决方案

1、备份用户数据

  由于数据全部都放Dell M3200存储中,因此只需要恢复Dell M3200存储中的数据即可。将Dell M3200存储中所有的硬盘标上编号,然后从存储中拔下来交给硬件部门检测硬盘是否存在物理故障。经检测没问题后对每块硬盘做全盘镜像,使用专用工具(Winhex)将硬盘中所有扇区镜像到一块备份硬盘中。

  如下图:使用北亚专业工具(http://www.sjhf.net/Product_sv.aspx?nid=7)备份所有硬盘数据

wKiom1aglzLi67dyAAOIfj50ObA821.jpg

 

  2、重组磁盘阵列

  镜像完所有硬盘后,分析每块硬盘上的数据。分析后发现4块600G硬盘做了一个RAID5,另一块4T硬盘是做为数据备份使用。仔细分析4块600G硬盘中的数据结构,可以得出这个RAID 5的相关信息,如:条带大小,条带走向等信息。根据这些信息即可重组此RAID。

  如下图:使用专业工具重组RAID

wKioL1agl3GT9kj2AANZZnOy2Mw435.jpg

 

  如下图:是用专业工具打开硬盘阵列的情况

wKioL1agl3KTnpwEAACf8cnt5gc258.png

 

  3、扫描旧的文件索引项

  仔细分析硬盘底层数据,发现硬盘底层中还残留着许多以前文件系统的目录项及文件索引。经过仔细核对发现这些文件索引指向的数据都是用户丢失的文件内容。但由于整个硬盘太大,人工去搜索文件索引会很慢,因此编写一个提取文件索引项的小程序,对整个硬盘中所有存在的文件索引项做扫描,提取所有文件的文件索引项。

  4、分析扫描到文件索引项

  对扫描到的所有文件索引项做详细的分析,发现其索引项都是不连续的,并且大多都是以16K或8K对齐的。正常情况下的文件索引项是连续的,大小为固定的1K,每个文件索引项对应一个文件或目录。而扫描出来的这些不连续,并且不完整的文件索引项是无法正常索引到文件的内容。因此需要对扫描出来的文件索引项做加工处理。在扫描出来的文件索引项中搜索“VHD”,能找到一个“VHD”的文件记录。然后将这个片连续的文件索引项提取出来。接着再查看这段提取出来的文件索引项中是否有指向下一段文件索引项的记录或者是H20属性。如果有则根据文件索引项中的特征去匹配下一段文件索引项,如果没有则跳过这段文件索引项。根据以上方法基本能查到大多数的文件索引项片段。而缺失的文件索引项片段有可能被破坏了,但是可以从数据备份盘中去查找缺失的文件索引项片段,因此基本可以搜索到大部分的文件索引项。

  如下图:是文件索引项截图

wKiom1aglzaAgGewAAB4Gr6UOXI481.png

  5、将文件索引项组成完整的目录结构

  根据上述方法找到所有的文件索引项,然后根据文件索引项的编号将其拼接成整个目录项结构。以下是搜索到的部分文件索引项,由于有部分文件索引项被破坏,因此只能找到大部分文件索引项,但这些文件索引项已经足以拼接成整个目录结构了。

  如下图:是扫描到的文件索引项碎片

 

wKiom1aglzfRhrgjAABIbWgO8Yo636.png

 

  四、修复文件系统

  将重建好的目录结构和现有文件系统中的目录结构进行替换,然后使用专业工具修改部分校验值。再使用专业的工具解释这个目录结构即可看到原有丢失的数据了。

  如下图:是用专业工具解释出来的目录结构

wKioL1agl3WBaYbIAACIsmn_BvU982.png

 

 

wKioL1agl3WgPCZjAACFMzyFKJ0783.png

 

  为了确定数据是否正确,将其中一个最新的VHD文件恢复出来。然后将其拷贝到一台支持附加VHD的服务器上,尝试附加此VHD。结果附加成功,检查VHD中最新的数据是否完整。一切检查完整后将所有数据恢复到一块硬盘中。

  如下图:是恢复出来的所有虚拟机数据文件

wKiom1aglzmwrGd7AABl49YqivE403.png

  五、验证所有数据

  在一台测试服务器上搭建Hyper-V的环境,将恢复的虚拟机文件连接到这台服务器上。然后通过导入虚拟机的方式,将恢复的数据都迁移到新的Hyper-V环境。然后让客户来验证所有虚拟机是否完整。

  如下图:是虚拟机导入的过程

 

wKiom1aglzqi16a9AADquSPAMVk062.png

wKiom1aglz6RDBlDAAKnyTrqmUc396.png

 

  六、迁移所有数据

  在客户验证所有虚拟机没问题后,将所有数据拷贝至客户服务器中。然后利用导入的方式将虚拟机导入到客户的Hyper-V环境中。但是在导入的过程中出现以下错误:

wKioL1agl3zjgLy7AAE-uXIrmzQ244.png

 

  在经过查找资料后确定导入的方法不对,需要以下面的方式导入虚拟机:

wKioL1agl37iB28iAAFZlW5UKeI436.png

 

  重新导入后没有报错,导入成功的截图如下:

wKiom1agl0PQX8b8AAE7dwUk7iA494.png

 

  尝试启动所有虚拟机,所有虚拟机启动都没问题。截图如下:

wKioL1agl4GwjBAeAAEi9gUDvpw408.png

 

 

  七、数据恢复结论

  数据恢复成功。

  八、项目成员

 

姓名

职务

电话

E-MAIL

张晓娜

商务代表

18515283863

zxn@frombyte.com

张宇

项目主管

邓奇

存储恢复工程师

185xxxxxxxx

###@frombyte.com

张勇

数据库工程师

185xxxxxxxx

###@frombyte.com





本文转自 张宇 51CTO博客,原文链接:http://blog.51cto.com/zhangyu/1737279,如需转载请自行联系原作者
目录
相关文章
|
11天前
|
存储 数据库
服务器数据恢复—服务器RAID5故障数据恢复解析
RAID5作为应用最广泛的raid阵列级别之一,在不同型号服务器中的RAID5出现故障后,处理方法也不同。 RAID5阵列级别是无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存取技术,能在同一磁盘上并行处理多个访问请求,同时允许阵列中的任何一个硬盘出现故障。 实际案例中,raid5阵列最常出现的故障情况就是硬盘自行脱机,联机状态显示为DDD(Defunct Disk Drive,无效磁盘驱动器),硬盘出现物理故障或逻辑故障。
服务器数据恢复—服务器RAID5故障数据恢复解析
|
2月前
|
存储 Unix 关系型数据库
【服务器数据恢复】FreeNAS数据恢复案例
一台服务器通过FreeNAS(本案例使用的是UFS2文件系统)实现iSCSI存储,整个UFS2文件系统作为一个文件挂载到ESXi虚拟化系统(安装在另外2台服务器上)上。该虚拟化系统一共有5台虚拟机,其中有3台虚拟机中的数据比较重要:一台虚拟机上部署了ASP.net+SqlServer和PHP+mysql;第二台虚拟机安装的FreeBSD,部署了MySQL数据库;第三台虚拟机存放的是代码数据。
【服务器数据恢复】FreeNAS数据恢复案例
|
2月前
|
存储 运维 数据挖掘
【服务器数据恢复】断电导致服务器RAID故障的数据恢复案例
某品牌服务器中有一组由数块SAS硬盘组建的RAID5磁盘阵列,服务器操作系统是WINDOWS SERVER,服务器中存放企业数据,无数据库文件。 服务器出故障之前出现过几次意外断电的情况,服务器断电重启后没有发现异常,直到最后一次断电重启后RAID报错:“无法找到存储设备”,进入RAID管理模块后进行任何操作都会死机,服务器管理员多次重启服务器仍然无法进入系统。为了防止服务器内数据丢失,管理员联系我们数据恢复中心寻求帮助。
|
3月前
|
存储 运维 数据挖掘
服务器数据恢复—服务器进水,磁盘损坏的数据恢复案例
服务器数据恢复环境: 数台服务器+数台存储阵列柜,共上百块硬盘,划分了数十组lun。 服务器故障&检测: 外部因素导致服务器进水,进水服务器中一组阵列内的所有硬盘同时掉线。 北亚数据恢复工程师到达现场后发现机房内有一台存储柜中的机器都没有开机。和用户方沟通后得知:机房天花板渗水导致这台存储柜中最上方的两台服务器进水,其中一台服务器经过检修后可以正常工作,但是最上方的那台服务器则完全损坏。
服务器数据恢复—服务器进水,磁盘损坏的数据恢复案例
|
3月前
【服务器数据恢复】服务器硬盘磁头损坏的数据恢复案例
一台服务器上raid阵列上有两块硬盘出现故障,用户方已经将故障硬盘送到其他机构检测过,其中一块硬盘已经开盘,检测结果是盘片损伤严重;另一块硬盘尚未开盘,初步判断也存在硬件故障,这两块磁盘的数据没有成功恢复。用户抱着试一试的想法将2块故障磁盘送到北亚企安数据恢复中心进行检测和数据恢复。
|
3月前
|
存储 运维 虚拟化
【服务器数据恢复】Hyper-V虚拟机文件丢失的数据恢复案例
Windows Server操作系统服务器,部署Hyper-V虚拟化环境,虚拟机的硬盘文件和配置文件存放在某品牌MD3200存储中,MD3200存储中有一组由4块硬盘组成的raid5阵列,存放虚拟机的数据文件;另外还有一块硬盘存放虚拟机数据文件的备份。
【服务器数据恢复】Hyper-V虚拟机文件丢失的数据恢复案例
|
3月前
|
存储 运维 小程序
【服务器数据恢复】异常断电导致ESXi虚拟机数据丢失的数据恢复案例
服务器数据恢复环境: 一台服务器,虚拟化系统为esxi,上层使用iSCSI的方式实现FC SAN功能,iSCSI通过FreeNAS构建。 FreeNAS采用了UFS2文件系统,esxi虚拟化系统里有3台虚拟机:其中一台虚拟机安装FreeBSD系统,存放数据库文件;一台虚拟机存放网站数据;一台虚拟机安装Windows server系统,存放数据库数据和程序代码。 服务器故障: 机房供电不稳,服务器非正常关机,重启服务器后发现ESXI虚拟化系统无法连接存储。工作人员对服务器进行故障排查,发现UFS2文件系统出现故障,于是fsck修复UFS2文件系统并将ESXI虚拟化系统连接到存储上。 检查文件系
|
5月前
|
存储 Linux 数据库
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
服务器数据恢复环境: IBM某型号存储,6块sas硬盘组建一组raid5,划分一个lun分配给Linux服务器并格式化为OCFS2文件系统,共享给虚拟化使用,存放的数据包括24台liunx和windows虚拟机、压缩包文件和配置文件。 服务器故障: raid5阵列中成员盘坏了多块,阵列失效,数据丢失。
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
|
6月前
|
存储 固态存储 数据安全/隐私保护
北亚企安数据恢复-VSAN数据恢复方案
存储介质清单 :一共8台服务器节点,每节点2个磁盘组,其中1个磁盘组配置1块SSD固态硬盘,4块1.2T机械硬盘;另一个磁盘组配置1块SSD固态硬盘,4块2T机械硬盘。共计16块SSD固态硬盘和64块机械硬盘。 故障描述:一个节点服务器掉线,导致部分虚拟机无法访问。 期望恢复数据:恢复VSAN环境中故障虚拟磁盘数据。
|
6月前
|
运维 安全 数据挖掘
服务器数据恢复-服务器蓝屏无法启动的数据恢复案例
某公司一台华为机架式服务器,运行过程中突然蓝屏。管理员将服务器进行了重启,但是服务器操作系统仍然进入蓝屏状态。 导致服务器蓝屏的原因非常多,比较常见的有:显卡/内存/cpu或者其他板卡接触不良、硬盘出现物理故障、系统漏洞被利用,外部入侵、系统文件丢失或损坏等。这些情况都可能导致服务器蓝屏故障。 该公司将服务器送到北亚企安数据恢复中心。收到服务器后,北亚企安硬件工程师对故障服务器进行了物理故障检测,经过各方面的检测,没有发现服务器存在任何物理故障,也没有发现严重漏洞或者系统入侵的情况。初步判断服务器蓝屏的原因是操作系统损坏。