我们正在使用带有 check_smartmon 或其他 Nagios 插件的 Smartmontools 和 Nagios 监控我们服务器上的磁盘。它似乎有效,因为没有错误。但我怎么知道它是否真的有效?
如果能在磁盘上模拟错误并通过整个 Nagios 管道观察错误,那就太好了。从 Linux 或 FreeBSD 命令行,有没有办法在不损坏磁盘的情况下触发磁盘驱动器或阵列上的 SMART 故障?
我在smartmontools-support邮件列表上发现了一个旧的讨论,但不清楚是否添加了此功能。
如果驱动器固件支持它,
hdparm
则可用于通过其--make-bad-sector
选项手动损坏某些扇区。请注意,这确实会损坏一个扇区,这意味着:Current Pending Sector
Reallocated Sector Count
请注意
hdparm
区分“正常”和“标记”损坏:在前者中,任何读取都会超时,就好像该扇区真的坏了一样;在后者中,任何读取都将立即中止。一定要明白,使用上述方法,您实际上是在破坏扇区,并具有相关的重新分配事件 - 即您以某种方式“损坏”了您的驱动器。
最后,要在重新分配之前恢复扇区,您可以使用该
--repair-sector
选项。返回
smartmontools
:您可以使用旧驱动器来模拟此类错误,从而smartd
有机会提醒您并检查smartctl
配置的有效性。您不能在没有任何实际损坏的情况下模拟硬盘驱动器的损坏来检查Smartmontools的“功率”。 Smartmontools是一个非常好的工具,它可以正常工作,而且始终安全可靠。你可以换一些有坏扇区的硬盘吗?