故障类型: RAID损坏
典型特征:
◎ RAID存储中有多块物理硬盘指示灯报警;
◎ RAID管理中显示多块物理硬盘呈离线或丢失状态;
◎ RAID信息丢失,所有物理硬盘不再是ONLINE状态
◎ 无法进入RAID管理界面或查看RAID相关信息时死机
损坏程度星级评价: ★★★
解决方案
◎恢复流程
1、检测流程
a. 对故障RAID中的所有硬盘做完整物理检测,确定每个硬盘的运行状态是否良好;
b. 查看当前可以正常读取的物理硬盘底层数据流,确定属于故障RAID中参与数据存储的物理硬盘(非热备硬盘)。
2、恢复流程
a. 将当前所有运行状态良好的非热备硬盘完整备份至带有冗余功能的安全存储中,对于存在物理问题的硬盘须先按照相应故障类型的解决方案进行恢复,并尽最大可能将故障物理硬盘的数据同样备份至安全存储;
b. 对当前已完整备份的所有硬盘镜像进行分析,确定故障RAID的原结构参数(RAID级别、条带块大小、硬盘盘序、数据校验方式等),同时判断故障RAID中各硬盘的离线情况;
c. 依据分析所得RAID参数及离线硬盘情况在只读环境中构建RAID数据,并对所构建的虚拟RAID进行基本的逻辑校验,确定文件系统大体结构无误后将RAID生成完整镜像;
d. 对备份生成的RAID镜像进行完整的逻辑分析和校验,若镜像内的文件系统仍存在不一致情况,则依据相应文件系统损坏情况的解决方案进行修复,直至迁移出用户所需数据。
3、验收流程
a. 对已迁移出来的所有数据做属性统计,从文件数量和容量等方面确保用户所需数据已全部迁移成功;
b. 对已迁移出来的所有数据做完整性验证,确保文件在目录结构及底层逻辑等方面正确无误;
c. 对用户指定的关键数据文件进行针对性校验,确保用户关键数据成功恢复。
◎ 恢复的可靠性分析以及时间预估
a. 若存储为RAID信息损坏的单一故障类型(文件系统无损坏),则恢复成功率非常高,时间为1天-3天不等;
b. 若存储内文件系统或数据库出现一定损坏,数据恢复工作会比较棘手,但成功率也比较高,时间为2天-4天不等;
c. 若对RAID做过强制ONLINE或REBUILD操作,此时存储内的文件系统和数据可能已受损,多数情况下将影响数据恢复的成功率。极端情况下,数据恢复工作可能。
www.zhj-data.cn 400-1366-898 0592-3557868 联系人:岑工