我有一台带有 Adaptec 6405 RAID 控制器和 4 个 RAID 5 配置磁盘的服务器。数据中心的工作人员打电话给我,因为他们注意到其中一个驱动器托架中的红色 LED 灯亮了。
然后,我使用“arcconf getconfig 1”检查了状态,并收到状态消息“逻辑设备/失败/降级:2/0/1”。
逻辑设备的状态被列为“正在重建”。但是,我没有得到受影响的物理设备的任何可疑状态,SMART 设置为“否”,SMART 警告为“0”,并且“arcconf getsmartstatus 1”没有返回任何磁盘驱动器的问题。
'arcconf getlogs 1 events tabular' 命令提供了大量输出(抱歉,无法将日志文件粘贴到此处,因为我只有远程控制台访问权限,但我可以发布屏幕截图)。以下是一些示例条目:
eventtype FSA_EM_EXPANDED_EVENT
grouptype FSA_EXE_SCSI_GROUP
subtype FSA_EXE_SCSI_SENSE_DATA
subtypecode 12
cdb 28 00 17 c4 74 00 00 02 00 00 00 00
data 70 00 06 00 00 00 00 00 00 00 00 00 02 00 00 00 00 00 00 00 00 00 00 00 00 0
'arcconf getlogs 1 device tabular' 命令报告两个磁盘的 mediumErrors 1。
今天,我再次检查了控制器的状态。一切恢复正常,控制器状态现在是'Logical devices/Failed/Degraded: 2/0/0',逻辑设备也都恢复到'Optimal'。我无法检查 LED 状态,我猜是红色 LED 又熄灭了。
现在我有很多问题:
- 介质错误的可能原因是什么,为什么 SMART 日志也没有报告?
- 我应该更换磁盘驱动器吗?它们是一个月前购买的。
- 重建过程需要一两天,这正常吗?每个磁盘为 2 TB,存储系统大部分处于空闲状态。
- 日志的时间戳似乎显示了日志检索的时刻,而不是事件发生的时刻。
请告知,非常感谢所有帮助。
可能是一个不聪明的相关错误?取决于布线 SAS 不兼容。
哦,伙计,你问那个?它们现在处于完全保修期内 - 如果不更换它们并等到保修期满,您会得到什么?
嗯,是。很高兴它起作用了。请参阅,RAID 5、23TB 磁盘 = 无保护,RAID 5 开始故障转移 1tb。欢迎来到痛苦的世界 - 如果您重视数据,最好加入 Raid 6。
它们是大型慢速驱动器,需要很长时间才能重建,是的。
可能的。