发新话题
打印

说到磁盘阵列不得不说的东西(2)

说到磁盘阵列不得不说的东西(2)

怎样使阵列中失效的硬盘恢复正常?

在阵列中的一个或多个硬盘被标为失效,但是我们相当肯定它们是完好的,能否强行将失效硬盘恢复到理想状态并加回到阵列中,而不必将它们重建回阵列。
答:的确,当某个硬盘被控制卡认做有故障时,通常假定硬盘存在某种形式的缺陷,应当迅速予以更换,以防止由于阵列总是试图将它重建进阵列而导致阵列崩溃。
然而,在极少情况下,硬盘被标为故障,但其实是故障警告过早。也就是说硬盘由于其他某些环境因素而被踢出局且标为“故障盘”,但事实上硬盘没有任何物理问题,完全可以安全地编入现有的阵列中。
发生这种情况时,可以强行把硬盘设回理想状态而不用经过耗时的重建。 下面是操作的具体步骤:
1. 启动系统,按下(Ctrl+A或 Ctrl+D,根据您的系统的具体设定),进入控制卡BIOS。
2. 在控制卡BIOS窗口的右方,选中RAID图标并回车,将图标放大。
3. 选择阵列中处于故障状态的硬盘,同时按下 (Alt + F10 + O) ,注:是字母“O”而不是数字“0”。
4. 然后,按下(Alt + A)进入“执行(Action)”菜单,选择“令其理想化(Make Optimal)
5. 此时,故障盘就恢复到原来的理想状态。继续选择阵列中其他相信是完好的盘直到所有硬盘都达到理想状态。而后,您就可以实施正常的阵列操作。 这种方法适用于阵列中的每个硬盘都被标为“故障”,而其实早先操作系统处于无法访问状态。
但是,假如在任何RAID结构中有两个以上硬盘确实有问题,这个办法就不是恢复硬盘的可行之选,因为被迫理想化的硬盘通常会很快再度失效。

磁盘阵列同步的说明
对于RAID_1或RAID5的磁盘阵列来说,当一个硬盘损坏后,更新一个新硬盘并做Rebuild时会因为某个扇区不能读,造成Rebuild失败,从而使数据无法恢复。
在定义了RAID_1和RAID_5磁盘阵列后,应立刻进行同步(SYNCHRONIZATION)以确保磁盘阵列中相应的镜象数据(对于RAID1)和校验数据(对于RAID5)正确。
对RAID磁盘阵列进行同步是防止Rebuild失败的一个有效的步骤。IBM认为对于保护级别较高的系统应每周一次,同步做的越频繁Rebuild失败的可能就越小。对于大多数用户可采取一月一次或二次,这仍然可以达到比较高的保护级别,或也可采取与其它一些维护工作同步进行,如当进行磁带备份时进行一次数据同步。
随着一段时间的使用,通常硬盘上都会积累了一些瑕渍。这时磁盘上出现瑕渍的区段是可以通过文件的读取而通过镜象和校验数据来恢复的,但是如果磁盘上的瑕渍区段是不能读取的区域(如未被使用的或仅通过缓存读取的区域),此时就需要同步操作来使数据得以恢复。
另外如果磁盘阵列工作正常,即使磁盘上存在瑕渍也不影响正常使用。但是如果此时磁盘阵列中的另一个硬盘出现问题,这时就没有足够的数据来恢复瑕渍区段了,Rebuild操作就会失败。
可见同步可以帮助提早发现潜在的问题,因为同步操作是针对逻辑盘的,所以无论是可读取的文件区还是未被使用的区域,都可以通过镜象或校验数据在同步操作的过程中对瑕渍区段进行从写而得以恢复。这样在有一个硬盘出问题时,Rebuild操作能正常完成,从而达到数据的保护。
注:请注意系统中RAID卡的版本,PCIF/WFAID卡版本应在2.43以上,MicrochannelF/WStreamingRAID卡版本需在2.21以上。

TOP

发新话题