我想建立一个存储服务器并购买了10 x 2TB WD RED's
. HDD's
刚到的。
在将真实数据复制到磁盘之前,你们有没有什么工具可以用来检查坏驱动器或最好地防止婴儿死亡?
是检查每个单独的还是通过复制大量数据HDD
来测试数组 ( ) 更好?ZFS raid-z2
我想建立一个存储服务器并购买了10 x 2TB WD RED's
. HDD's
刚到的。
在将真实数据复制到磁盘之前,你们有没有什么工具可以用来检查坏驱动器或最好地防止婴儿死亡?
是检查每个单独的还是通过复制大量数据HDD
来测试数组 ( ) 更好?ZFS raid-z2
这些是新磁盘。他们要么会失败,要么不会。通过使用 ZFS 文件系统,您已经向前迈出了一大步,这将使您深入了解您的 raid 和文件系统健康状况......
除了构建阵列之外,我不会做任何事情。这就是冗余的意义所在。您将无法使用其他列出的方法引发驱动器故障。
2个月前我也有同样的问题。发送故障磁盘后,替换磁盘在 3 天后在我的 NAS 中出现故障。所以我决定在投入生产之前测试新的替代品。我不会测试我购买的每个新磁盘,只会测试我不完全信任的“翻新”磁盘。
如果您决定要测试这些磁盘,我建议您在全新的硬盘上运行badblocks扫描和扩展的 SMART 测试。
在一个 2TB 的磁盘上,这最多需要 48 小时,badblock 命令将一个模式写满磁盘,然后再次读取块以查看该模式是否确实存在,并将用 4 种不同的模式重复此过程。
该命令实际上可能不会显示新磁盘上的任何坏块,因为如今磁盘会重新分配坏块。
所以在此之前和之后我运行了一个智能测试,并检查重新分配和当前挂起的扇区数。如果其中任何一个上升,则您的磁盘已经有一些坏块,因此可能证明不可信。
在此之后,我再次运行扩展的 SMART 测试。
您可能想先安装 smartctl 或 smartmontools。
警告,badblocks -w 标志将覆盖您磁盘上的所有数据,如果您只想进行读取检查而不覆盖磁盘,请使用
badblocks -vs /dev/sdX
如果在此之后您的智能值看起来不错,我会相信磁盘。
要了解每个智能值的含义,您可以从这里开始查看
http://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technology
您可以使用 Bonnie++ 进行测试。它可以完美地模拟文件服务器行为模式。
例如:
测试将以用户“nobody”运行,并将创建/重写/删除 100*1024 个文件,每个文件从 200 到 150000 字节,在 /home/tmp 下的 100 个自动创建的目录中。测试次数 = 300。您可以玩弄文件数量/大小和测试重复次数。
我在一家日复一日进行此类测试的公司工作。是的,我们测试了我们购买的每一块硬盘。我们的流程首先通过一个名为 HDAT2 的基于 DOS 的免费程序运行驱动器。它可以免费下载。它可以访问 SMART 和驱动器的一些其他功能,这些功能在 Windows 环境中是无法访问的。根据那里的结果,我们将通过几条不同的专用硬件线之一运行它们,但在核心,它们大多只运行 SMART 短自检、长测试、安全擦除和全读来验证扇区。我的建议是对整个磁盘运行安全擦除,然后运行全部读取,然后进行 SMART 简短自检。这个顺序很重要,因为如果在测试开始时运行一个简短的自检可能找不到任何东西,但在对光盘进行完整的写入和读取之后,它可能会找到一些东西。希望这可以帮助。
我通常只是做一个完整的 RAID 初始化,并在适用的情况下,在此期间开始填充文件系统,一直都知道可能会因死驱动器而出现问题。这样,我就不会浪费任何时间进行某种无论如何都不可靠的测试,而且我会立即发现真正的弱驱动器。在那之后,由于“婴儿死亡率”,驱动器故障的可能性仍然会有所增加,但没有切实可行的方法来消除这种情况。
实际上,我在 RAID 中使用的最后几百个磁盘在运行的第一年都没有出现任何问题。
您可以使用制造商的测试套件或类似SpinRite的东西来扫描整个磁盘。查看SMART值、寻找坏扇区和其他老化/故障迹象也是一个好主意。
如果真的要测试,那就用
badblocks
write test。它将数据模式写入磁盘,然后读取它们进行检查。在此期间,它会给您的磁盘带来一些压力。在我看来,如果它成功运行,您可以信任该磁盘。但我认为 ZFS 和良好的备份就足够了。