所以我得到了这台服务器,如果其中一个驱动器上有视觉警报。
用我进一步调查后storcli
发现是有一些media error counts
。
我对此进行了一些调查,显然这些类型的错误是磁盘扇区上无法纠正的损坏,因此它被重新映射以不使用所述扇区。
但显然几乎所有驱动器都有这类错误广告,它们也是由制造缺陷引起的。
所以我有几个问题:
- 如果这是正常的,为什么只显示一些错误的视觉警报?
- 如何使用 storcli 查看有关这些错误的更多详细信息
- 有人可以向我解释什么是
other error count
和shield count
如果我误解了什么,请向我解释。
谢谢
我确认这
media error counts
意味着物理扇区坏了,通常在应用程序读取或阵列清理期间发现。在这种情况下,“扇区变坏”意味着物理磁盘无法读取原始扇区,从而将错误返回给 RAID 控制器。HDD 本身可以将扇区标记为“要重新映射”的事实对 RAID 控制器是透明的,它会简单地尝试通过使用来自其他镜像分支/奇偶校验的数据来重新写入同一扇区。如果此重写失败(意味着驱动器本身没有可用的备用扇区),则该磁盘通常被标记为失败。
如果是偶发的,这样的读取错误并不太令人担忧,实际上大多数 RAID 控制器仅在超过某个错误阈值后才将磁盘标记为坏磁盘。换句话说,只会报告 1 个媒体错误,而 100+ 个错误肯定也会将磁盘标记为坏(或“预计将很快失败”状态)。