|
SCSI开盘无法解决!
复杂RAID无法重组!
数据库无法修复!
困扰用户的问题实在是太多了。上海某知名进出口贸易有限公司的一个TB级大型服务器RAID磁盘阵列在一个月前崩溃。由于管理员的误操作,该阵列在已经有单个硬盘提示掉线的情况下仍然运行了长达半年之久。随后,当另一块硬盘也掉线之后,整个RAID陷入瘫痪。由于公司所有的客户资料数据与财务数据都保存在其中,因此整个公司的IT部门都为此大伤脑筋。
在公司IT部门负责人的引荐下,公司分别寻找了三家数据恢复服务商,但是所得到的答案却皆是无能为力。第一家公司以RAID数据恢复为特色,不过一看到有两个SCSI硬盘掉线,当即表示无法进行数据恢复操作,因为无法得到SCSI镜像;第二家公司尽管精通硬盘维修,但是却并非专业的数据恢复服务商,而且不仅无法修复SCSI硬盘,复杂的RAID更是无法处理。好不容易找到第三家数据恢复公司,对方在详细了解情况后,认为SCSI开盘、RAID重组以及后期可能存在的数据库修复都是难道太大的操作,因此婉言拒绝。
整个公司顿时陷入了迷茫,在悔恨当初缺乏备份意识的同时,也为恢复无门而感到懊丧不已。这时,公司决定不再依托熟人,而是直接在网络上选择一家数据恢复服务商,并且不惜一切代价进行恢复。在反复对比之后,飞客数据恢复中心有幸承接了这一案例。
【恢复难题之一:SCSI开盘】
由于已经有两块SCSI硬盘损坏,因此必须至少得到其中一个硬盘的完整镜像,否则根本无法进行RAID重组。此外,其中一个损坏的硬盘在半年前就已经掉线,所以留给飞客的机会实际上只有一个。SCSI硬盘之所以开盘成功率低,其磁头数量多而导致的结构复杂是主要原因。然而更为重要的是,由于相关案例接触得较少,因此数据恢复工程师并没有摸索到一套行之有效的经验。为了解决这些问题,飞客研发部曾经购买了80块捷豹系列SCSI硬盘,专门对其内部结构进行深入研究。尽管研发成果并不如期待中那样十全十美,但是如今已经能够解决更换磁头问题,而且研发出不同于普通硬盘的数据导出方法。在紧张的第一步操作中,飞客硬件工程师交出了令人满意的答卷,最终整盘镜像成功提取,为后续的恢复操作打下坚实的基础。
【恢复难题之二:RAID重组】
由于该RAID磁盘阵列在前几次送修过程中已经打乱了盘序,而且RAID控制卡不支持自动排序,因此稍微给重组带来一些小麻烦。但是,更大的困难在于这是一个类似HP双循环的特殊RAID5,其算法的特殊性要求工程师必须充分进行分析,然后得到正确的重组方法。此外,整个RAID的容量非常巨大,这对于软件的稳定性有着非常高的要求。经过大约为其三天的努力,RAID重组方案终于在多次试验之后获得成功。
【恢复难题之三:数据库修复】
看到部分数据之后,飞客工程师立即通知了客户。当时,在电话里可以清清楚楚地听到整个办公室的欢呼之声,其数据重要性可见一斑。但是,就当大家都认为已经大功告成之时,客户验证数据库失败。Oracle8无法导入恢复后的数据库文件,而且备份文件和日志文件均有损坏。分析原因,这很可能是恢复过程中,重组部分还是略有缺陷,也有可能是RAID信息崩溃时破坏部分数据结构,并伴随着MFT表损坏。
为了节省客户的时间,飞客临时项目技术主管决定双线操作:一方面重新进行重组分析,另一方面尝试修复数据库文件。万幸的是,在北京总公司研发部的支持下,数据库文件很顺利地完全修复。至此,整个数据恢复宣布成功!
工程师总结手记:
看似一个简单的数据恢复案例,其实综合了多个学科领域。SCSI开盘更像是机械技术,RAID分析重组和数据库恢复也完全是不同的分支学科。从今后的发展趋势来看,随着用户的应用逐渐专业化,对于数据恢复技术人员的要求也将越来越高。 |