我的机器中有一个 500G SATA 硬盘驱动器,它突然开始给我 I/O 错误,直到 Linux 简单地断开驱动器。重新启动,然后它会随机运行一段时间,然后再次失败。
该驱动器在保修期内,但我在无法重现问题的商店中遇到了不好的经验,因为驱动器不会一直出现故障。然后他们只是给我寄了一张账单,然后开车回去。
确保他们可以重现问题的最佳行动方案是什么?
更新:那些推荐了诊断工具的人,这是一个很好的有效答案,正如我的问题所述,我正在运行 Linux,并且这些工具不存在。至于“游戏”商店,不是这样的。如果没有我的帮助,该驱动器将完全无法使用。我只是在谈论加快进程。
更新2:我真的不知道为什么我决定在这里问这个。我希望得到一些建议,例如“做一个坏扇区测试”、“尝试通过使用 dd 将随机数据复制到驱动器来给驱动器施加压力”。我会再说一遍,所以停止建议或建议我不要...我不会以任何方式通过弄乱硬件本身来终止我的保修,包括:大容量橡皮擦、巨大的磁铁、过多的功率或驱动器最终送回制造商时会出现的任何东西。
驱动器制造商是否有实用程序来检查驱动器?
他们通常会提供一个实用程序,您可以使用该实用程序进行一些诊断 - 这可能应该是您的第一步。检查那里的网站并下载(如果有)
我认为最好的办法是打电话给他们并讨论这种情况——任何形式的“游戏”他们都可能毫无意义,而且很可能适得其反。这些人习惯于处理客户的一系列问题,我想如果您提出要求,他们会很乐意为您提供帮助。
我建议使用SpinRite以及制造商的工具。我以前用它来恢复死驱动器上的数据。SpinRite 的伟大之处在于它可以检测错误率(每 MB 的错误)。
通常在对驱动器进行 RMA 时,它们会让您从其诊断工具中包含某种状态代码。
我不以我的巨大耐心而闻名,所以我将自己回答这个问题。也许这会帮助以后的人。
坏块检查
写压力测试
阅读压力测试
SATA 断开连接
我有一个 USB 到 (S)ATA 适配器,如果磁盘在任何时候停止响应,它能够重置 USB 设备。当 Linux 因太多 i/o 错误而断开驱动器时,这是一种解决方法。
我还建议确保驱动器底部的控制器不会变得太热。这对我来说听起来像是一个热量问题。
如果您能够消除热量作为原因,那么我会打电话给制造商。在与制造商交谈并首先获得 RMA 时,我从来没有遇到过问题。发送时,我还建议您详细说明您所看到的内容。
好好锻炼一下: http ://www.textuality.com/bonnie/
几天后应该会显示它是否真的要结束它。
Bonnie 在大多数发行版的存储库 IIRC 中。
完成即将死去的硬盘的最佳方法是什么?
如果你有一个橡胶槌,用它敲击它——它会在内部破坏一些东西,但不会留下任何痕迹。
经过时间考验的解决方案 - 但前提是它在保修期内!
驱动器制造商通常会提供诊断实用程序,您可以在发送驱动器之前运行这些实用程序。一旦你从它们的实用程序中得到 I/O 错误,你就可以包含日志,它们就不太可能对你的问题提出异议。
我强烈建议不要用人们可能听说过的“技巧”(高压、微波炉、大容量胶带橡皮擦)来愚弄他们。他们比你或我更习惯于处理这些事情。
可能他们并没有真正彻底地测试驱动器。
给他们你的问题文件。如果这不能满足您的同意,那么您就有一个根本问题。
根据您的描述,您的问题可能是控制器和驱动器之间的交互。例如,您的控制器可能不擅长处理边缘驱动。或者你可能有一个糟糕的控制器。
理想情况下,您与供应商的协议将指定是否预期/保证与您的控制器一起工作 - 或者这将使他们也对控制器(和驱动程序)负责。
我已经看到很多 SATA 驱动器的行为与您描述的方式一样 - 有时是正常业务过程的一部分,有时是在发生故障的过程中。有时它被承认是固件错误。根据我的经验,500GB 驱动器尤其糟糕。
通过使用不同的控制器重复问题,您将显着帮助您的案例,因为驱动器很可能无法与任何特定控制器一起使用,或者您不会遇到此问题。