Adam Davis Asked: 2009-05-02 09:19:52 +0800 CST2009-05-02 09:19:52 +0800 CST 2009-05-02 09:19:52 +0800 CST 测试 RAID 772 如何全面评估 RAID 配置? 拉动驱动器是一回事,但有更多的工具和技术吗? 我考虑过将钉子穿过正在运行的驱动器(粉末驱动的钉枪)以查看会发生什么,或模拟各种电气异常(电缆短路/开路、功率过载和浪涌等)。 应该测试什么,如何测试? -亚当 testing raid 2 个回答 Voted Best Answer Tom Ritter 2009-05-02T09:44:32+08:002009-05-02T09:44:32+08:00 在不能选择热插拔的驱动器中,许多raid 控件(例如linux 上的mdadm)都有一个模拟驱动器故障的set-faulty 命令。 在可以热插拔的驱动器中,猛拉驱动器! 我认为您的测试应该涵盖您计划的合理案例。如果您尝试在灌木丛中设置服务器,那么电气波动是合理的测试套件。如果您在数据中心,服务协议可能涵盖电力。 如果您认为在机架内疯狂爆炸的驱动器是合理的,那么请对其进行测试。也许您正在巴格达的指挥中心设置服务器。但再一次,如果你在华盛顿州,可能性就会降低。 作为一般规则,您的测试应涵盖所有预期的情况: 驱动器很旧,最终会变坏(找到一个驱动器,让它运行,然后敲打它直到它失败) 驱动器未能通过智能测试,但看起来不错,但您想更换它以防万一 由于尺寸/性能升级或您刚刚听说批次不好而进行一般驱动器更换 和合理的极端情况。 服务器突然断电 - 好的。 服务器本身被闪电击中 - 不是那么多。 机架翻倒 - 好的。 机架被卡车撞到 - 没那么多。 驱动器被推挤 - 好的 驱动器被铅球 - 不是那么多。 最重要的是 - RAID 不能防止驱动器默默地破坏数据!因此,请确保您正在进行哈希和文件验证! carlito 2009-06-02T12:01:36+08:002009-06-02T12:01:36+08:00 如果您关心整体解决方案的最终可靠性,那么测试驱动器的非正常故障确实很重要。我见过的每个失败的 RAID 解决方案(意味着冗余不能防止出现故障的驱动器)都是由于未能测试真正的驱动器故障。正常的测试是拉驱动器,声称驱动器故障已被测试,然后继续。 最好的解决方案可能是拥有一组边缘驱动器,或导致响应不一致的修改固件。只有存储供应商才有可能拥有这种能力。 我喜欢将钉子穿过正在运行的驱动器的想法,但相邻驱动器上的力可能会导致不切实际的灾难性故障。或者驱动器的完全故障可能导致不切实际的干净故障。 如果允许我对 RAID 进行合法测试,我会用不同的方式销毁一些驱动器。将电线连接到驱动器板上的随机组件并将它们油炸或短路。如果外壳的几何形状使得这不太可能破坏相邻的驱动器,则确实将钉子穿过驱动器。(我认为数组其余部分的推挤是一个合理的测试)。拦截驱动器的数据路径并返回所有可能的错误、无意义的结果或延迟随机时间量的正确结果。 期望驱动器有时会返回错误的块。预计驱动器会在其连接上引起任何可能的电气问题。 我的经验是,考虑购买存储的人都不想进行真正的测试。这可能会暴露出真正的问题。我很想知道是否有人真正测试了存储可靠性——当然他们没有公布他们的结果。
我认为您的测试应该涵盖您计划的合理案例。如果您尝试在灌木丛中设置服务器,那么电气波动是合理的测试套件。如果您在数据中心,服务协议可能涵盖电力。
如果您认为在机架内疯狂爆炸的驱动器是合理的,那么请对其进行测试。也许您正在巴格达的指挥中心设置服务器。但再一次,如果你在华盛顿州,可能性就会降低。
作为一般规则,您的测试应涵盖所有预期的情况:
和合理的极端情况。
最重要的是 - RAID 不能防止驱动器默默地破坏数据!因此,请确保您正在进行哈希和文件验证!
如果您关心整体解决方案的最终可靠性,那么测试驱动器的非正常故障确实很重要。我见过的每个失败的 RAID 解决方案(意味着冗余不能防止出现故障的驱动器)都是由于未能测试真正的驱动器故障。正常的测试是拉驱动器,声称驱动器故障已被测试,然后继续。
最好的解决方案可能是拥有一组边缘驱动器,或导致响应不一致的修改固件。只有存储供应商才有可能拥有这种能力。
我喜欢将钉子穿过正在运行的驱动器的想法,但相邻驱动器上的力可能会导致不切实际的灾难性故障。或者驱动器的完全故障可能导致不切实际的干净故障。
如果允许我对 RAID 进行合法测试,我会用不同的方式销毁一些驱动器。将电线连接到驱动器板上的随机组件并将它们油炸或短路。如果外壳的几何形状使得这不太可能破坏相邻的驱动器,则确实将钉子穿过驱动器。(我认为数组其余部分的推挤是一个合理的测试)。拦截驱动器的数据路径并返回所有可能的错误、无意义的结果或延迟随机时间量的正确结果。
期望驱动器有时会返回错误的块。预计驱动器会在其连接上引起任何可能的电气问题。
我的经验是,考虑购买存储的人都不想进行真正的测试。这可能会暴露出真正的问题。我很想知道是否有人真正测试了存储可靠性——当然他们没有公布他们的结果。