IBM DS4800数据恢复案例
一:故障设备:IBM DS4800 存储 挂三个扩展柜二:故障现象:
有一个扩展柜有块硬盘9号报错 热备盘自动顶上后 30分钟内又回写回去 可是却回写到13号位置的硬盘上 导致9号盘依然提示为可预期的错误,13号盘为replaced状态. 整个raid5组为degraded状态.客户打电话咨询设备商,设备商让更换9号位置硬盘,存储竟然没有让热备盘顶上 结果整个array变为failed.
三:恢复流程
1:客户数据非常重要,不能有任何丢失。所以将客户所有硬盘全部镜像到新的FC光纤硬盘上。用时12 小时。
2:分析镜像出来的数据块,和RAID信息。看是否发生变化或有硬盘数据不同步,早离线的硬盘。
3:将镜像好的新硬盘接上报警的阵列柜上,还是9号硬盘与13号硬盘报错。
4:强制将9号盘与13号硬盘上线,我们先上线9号盘。因为在9号没有替换前,数据可以访问。上线9号 硬盘后,阵列显示状态正常,但oracle还是无法访问。再上线13号硬盘。此时RAID5状态已正常, 所有硬盘状态正常。
5:访问oracle还是不行,重新mount丢失的卷,进行fdisk卷修复。修复成功后,再重新起oracle。就 正常了
四:注意事项
当磁盘阵列发生问题时,千万不要慌,防止误操作导致数据损坏。一般RAID5支持任何一块硬盘离线 当RAID5出来无法访问时,肯定还有另外一块硬盘出了问题。只是服务器没有报警或硬盘没有报警。 如果硬盘报警离线,数据还可以访问。此时最安全的操作就是备份数据,等数据全部备份好了,你想 怎么操作都可以了。
学习了,收藏! {:6_392:}{:6_392:}{:6_392:}{:6_392:}{:6_392:}{:6_392:}{:6_392:}{:6_392:}{:6_392:}{:6_392:}{:6_392:}{:6_392:} {:6_404:}{:6_404:}{:6_404:}{:6_404:}{:6_404:}{:6_404:}{:6_404:}{:6_404:}{:6_404:}{:6_404:}{:6_404:}
页:
[1]