我有一个 3ware 9650SE RAID 控制器和一个包含 15 个希捷 ST31000340NS 磁盘的 RAID 5 阵列。在注意到端口 10 驱动器中的 ECC 错误后,我将其替换为备用驱动器并开始重建 RAID。在重建过程中,端口 5 磁盘完全失败,导致阵列无法运行,因为端口 10 中的新磁盘不完整。该阵列在重建期间一直使用,直到端口 5 磁盘出现故障。我希望通过放回原来的端口 10 磁盘来恢复数据,但是 RAID 控制器没有将其添加回阵列。相反,它被列为“可用”。我的问题是,如何强制控制器在其原始位置识别原始端口 10 磁盘?3dm2界面中没有“添加磁盘”选项。
* 额外信息 *感谢所有与我的原始帖子有关的意见和建议。我之前应该提到过,阵列在重建期间以只读方式安装。我不知道这对强制控制器接受原始磁盘的机会是否有任何影响。顺便说一句,没有备份。不管发生什么,我当然已经吸取了教训。RAID5。
我相信你运气不好。这是 RAID5 的危险之一。由于阵列正在使用中,所有其他磁盘现在都与原始端口 10 磁盘不同步。
更新:关于更新只读安装......这是否有效将成为 3ware 的实现细节。即使您以只读方式安装,raid 控制器也可能更新了磁盘上的一些元数据,并决定此配置不可恢复。这就是我所期望的。
您最好的选择是从备份中重建。由于阵列正在使用中,因此 10 磁盘上的数据将不同步。
随着驱动器尺寸变大,不再推荐使用 RAID 5;驱动器上出现不可恢复错误的几率正在增加,并且通常直到您在 RAID 5 阵列上出现磁盘故障(即发现第二个磁盘及其潜在坏点时)才被发现。
如果第二个驱动器上的错误出现在文件系统未使用的磁盘部分中,您可能会很幸运。因此,如果您没有任何备份,您可以尝试使用“在重建时忽略 ECC 错误”标志集进行重建。然后,您可能希望对文件系统运行某种形式的一致性检查,并且在最坏的情况下您可能不得不预期一些数据损坏。尽管如此,丢失整个音量可能更可取。
以今天的磁盘大小,当一个驱动器已经发生故障时另一个驱动器发生故障的概率是 62%,当消费磁盘时: http ://talkback.zdnet.com/5208-12694-0.html?forumID=1&threadID=36299&messageID=1008171
永远不要使用raid 5。如果您必须提供高可用性和廉价存储,请选择 raid6 和热备件。
如果您的阵列在端口 10 上移除故障磁盘后仍保持联机并接收写入,则这意味着该磁盘与阵列的其余部分不一致,即使您可以强制它联机,阵列上的任何卷也会损坏。
别问我怎么知道的……
从备份恢复可能是您唯一可行的选择。