我有许多使用 3ware RAID 控制器的 CentOS 5 服务器。
这些服务器向我的团队发送关于微小温度变化的消息,如下所示:
Jun 8 12:32:39 HOST smartd[1231]: Device: /dev/twa0 [3ware_disk_01], SMART Usage Attribute: 194 Temperature_Celsius changed from 119 to 118
Jun 8 12:32:39 HOST smartd[1231]: Device: /dev/twa0 [3ware_disk_03], SMART Usage Attribute: 194 Temperature_Celsius changed from 122 to 121
我怎样才能抑制这些消息?
根据 man smartd.conf:
要禁用 3 种报告中的任何一种,请将相应的限制设置为 0。可以省略尾随零参数。默认情况下,禁用所有温度报告 ('-W 0')。
在我的系统上,smartd 默认报告温度变化。
我尝试了手动方法。在/etc/smartd.conf
中,我有以下内容:
/dev/twa0 -d 3ware,1 -a -W 0
/dev/twa0 -d 3ware,3 -a -W 0
但这仍然不会抑制消息。
由于这些消息显示在 /var/log/messages 中,因此 LogWatch 每晚都会发送不必要的电子邮件。
好的,既然我们已经确定您的磁盘不会因为您可以触摸它们而自行熔化,我想说 Jason 调整 LogWatch 的想法是正确的。
自从我查看 LogWatch 以来已经有一段时间了(我认为它很糟糕并且通常会禁用它),但是您绝对可以使用禁用温度警报
ignore.conf
(这个问题以及 LogWatch 文档中有一些关于此的信息) .更好的解决方案是确定报告的温度值的确切含义——显然 SMART 温度属性没有明确定义,甚至
smartctl
手册页也对供应商供应商实施之间的可变性说了一些不讨人喜欢的事情:如果您联系您的 HD 供应商,他们可能会让您深入了解他们的驱动器为温度参数返回的内容,并且您可能会告诉 LogWatch 何时发出警报(或将 LogWatch 配置为忽略消息并实施一个更智能的监控系统来寻找实际的故障情况)。