你最喜欢的 Linux 发行版是什么？[关闭]

Question

lexsys

Asked: 2009-06-26 22:26:00 +0800 CST2009-06-26 22:26:00 +0800 CST 2009-06-26 22:26:00 +0800 CST

我应该担心高 SMART Hardware_ECC_Recovered 值吗？

772

我收到这样的消息/var/log/messages：


Jun 25 06:29:27 server.ru smartd[4477]: Device: /dev/sda, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 46 to 47

#smartctl -a /dev/sda：


smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   110   088   006    Pre-fail  Always       -       28526210
  3 Spin_Up_Time            0x0003   093   093   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       24
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   087   060   030    Pre-fail  Always       -       471723621
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       2520
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       41
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   068   052   045    Old_age   Always       -       32 (Lifetime Min/Max 31/35)
194 Temperature_Celsius     0x0022   032   048   000    Old_age   Always       -       32 (0 27 0 0)
195 Hardware_ECC_Recovered  0x001a   047   045   000    Old_age   Always       -       105036390
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

这是否意味着磁盘出现故障并且我必须更换它？我在哪里可以阅读有关 SMART 测试结果的解释？

6 个回答

Voted

Dave Cheney · Answer 1 · 2009-06-26T22:56:02+08:00

Best Answer

Dave Cheney

2009-06-26T22:56:02+08:002009-06-26T22:56:02+08:00

根据Spinrite名声的史蒂夫·吉布森 (Steve Gibson) 的说法，SMART 值必须随着时间的推移而被采用，而不是瞬时读数。这意味着，如果值已连续数月为 47，则 47 的值不一定是坏的。但是，如果该值在一小时前是 42，并且它迅速攀升，那么这意味着驱动器在访问部分数据时遇到了困难，并且可能很快就根本无法读取该扇区。根据该驱动器上数据的值，您可能希望替换它。

16

Robert Klemme · Answer 2 · 2016-08-06T12:21:35+08:00

Robert Klemme

2016-08-06T12:21:35+08:002016-08-06T12:21:35+08:00

这个属性的高值实际上是相当不错的：

Hardware ECC Recovered SMART 参数指示 ECC 纠正错误之间的时间。

https://kb.acronis.com/content/9131

12

CesarB · Answer 3 · 2009-06-27T09:12:00+08:00

CesarB

2009-06-27T09:12:00+08:002009-06-27T09:12:00+08:00

首先，对于 SMART，较低的值更糟糕，而不是较高的值（请注意阈值列总是低于当前值）。因此，价值增加不必担心。（但是，此规则不适用于原始值。）

SMART 值往往会有些波动（例如，您的值可能在 46 和 47 之间，因此即使很小的变化也可能导致它翻转到另一个值）。

您的smartctl -a输出显示该值最差的是 45，因此它的振荡略高于它是正常的。

有关更多信息，请查看 Wikipedia：ATA SMART 属性。

请注意，“越低越差”仅适用于标有“值”、“阈值”和“最差”的三列中的值。并且不一定适用于“原始值”，因为那里的值没有被该指标标准化。

7

jasonrm · Answer 4 · 2009-06-27T09:28:12+08:00

jasonrm

2009-06-27T09:28:12+08:002009-06-27T09:28:12+08:00

请记住，即使 Google 进行的广泛研究也发现大量驱动器故障并非由 SMART 错误预测。您所看到的可能完全正常，但由于每个制造商都有不同的指标将原始值转换为报告值，因此很难确定您的驱动器是否遇到很多错误。然而，一个如此大的原始数字确实让我觉得很奇怪。

我建议阅读所有驱动器（dd 或 rsync'ing 到新驱动器）并检查 SMART 值。如果您看到该原始数字或报告的值，请进行很多更改，我会开始寻找更换驱动器。

4

ConcernedOfTunbridgeWells · Answer 5 · 2009-06-27T02:55:13+08:00

ConcernedOfTunbridgeWells

2009-06-27T02:55:13+08:002009-06-27T02:55:13+08:00

IIRC 硬件 ECC 恢复是对磁盘读取的纠错，这对于磁盘来说并不少见，正是出于这个原因，它们使用纠错机制对数据进行了编码。一些控制器还支持磁盘扇区中的冗余信息并添加另一层纠错。

正如戴夫·切尼所说，应该随着时间的推移监测这些数字。这些统计数据的根本变化表明驱动器出现故障。此外，请密切关注增长的缺陷列表 - 如果增长的缺陷列表开始增长或 SMART 统计数据开始显着变化，那么您应该预防性地更换驱动器。

3

cstamas · Answer 6 · 2009-06-27T00:59:26+08:00

cstamas

2009-06-27T00:59:26+08:002009-06-27T00:59:26+08:00

它没有错。

你可以随时运行

smartctl -t long /dev/yourdrive

然后几个小时后查询它的结果

smartctl -a /dev/yourdrive

只是要确定。

1

我应该担心高 SMART Hardware_ECC_Recovered 值吗？

SFTP 使用什么端口？

从 IP 地址解析主机名

如何按大小对 du -h 输出进行排序

命令行列出 Windows Active Directory 组中的用户？

Windows 中执行反向 DNS 查找的命令行实用程序是什么？

如何检查 Windows 机器上的端口是否被阻塞？

我应该打开哪个端口以允许远程桌面？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

我应该担心高 SMART Hardware_ECC_Recovered 值吗？

6 个回答

相关问题