AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 485147
Accepted
nn4l
nn4l
Asked: 2013-03-07 00:49:52 +0800 CST2013-03-07 00:49:52 +0800 CST 2013-03-07 00:49:52 +0800 CST

驱动器出现故障但 LSI MegaRAID 控制器未检测到它

  • 772

smartmontools 报告在 RAID1 配置中使用的驱动器上的不可读扇区数量不断增加。我认为 LSI MegaRAID 控制器还会检查其磁盘驱动器的 SMART 状态,因此应该将驱动器识别为故障并将其标记为脱机?

smartctl -d sat+megaraid,7 -a /dev/sda 的输出:

...
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       69
...
Error 11 occurred at disk power-on lifetime: 9704 hours (404 days + 8 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 11 6f cd 04 0f  Error: UNC at LBA = 0x0f04cd6f = 251972975

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
-- -- -- -- -- -- -- --  ----------------  --------------------
60 69 38 17 cd 04 40 00   2d+11:27:29.750  READ FPDMA QUEUED
61 10 30 98 12 55 40 00   2d+11:27:29.750  WRITE FPDMA QUEUED
61 01 28 57 86 da 40 00   2d+11:27:29.750  WRITE FPDMA QUEUED
60 09 20 f7 d1 04 40 00   2d+11:27:29.750  READ FPDMA QUEUED
60 80 18 00 d2 04 40 00   2d+11:27:29.750  READ FPDMA QUEUED
...
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      9700         -
# 2  Short offline       Completed without error       00%      9676         -
# 3  Extended offline    Completed: read failure       90%      9673         251972659

MegaCli -AdpAllInfo -aAll 的输出:

Product Name    : LSI MegaRAID SAS 9260-4i
...
================
Virtual Drives    : 2
  Degraded        : 0
  Offline         : 0
Physical Devices  : 5
  Disks           : 4
  Critical Disks  : 0
  Failed Disks    : 0

请告知 RAID 控制器行为是否正常或某处是否配置错误。控制器应该处于出厂状态,我只将四个物理磁盘配置为两个 RAID1 卷。

无论如何都会更换坏盘。

更新:我了解到实际上有一种方法可以了解此类错误(见下文),但我认为此类信息会显示在更突出的状态信息中,而不是隐藏在日志文件中。

似乎 RAID 控制器没有标记这个磁盘,因为它仍然可以从这种错误情况中恢复。

raid
  • 1 1 个回答
  • 17490 Views

1 个回答

  • Voted
  1. Best Answer
    nn4l
    2013-03-21T00:20:59+08:002013-03-21T00:20:59+08:00

    要查看 RAID 控制器日志,请运行以下命令:

    /opt/MegaRAID/MegaCli/MegaCli -AdpEventLog -GetLatest 1000 -f events.log -aALL
    

    events.log 文件包含如下条目,表明磁盘存在问题:

    Code: 0x0000006e
    Class: 0
    Locale: 0x02
    Event Description: Corrected medium error during recovery on PD 07(e0xfc/s2) at f04cb53
    Event Data:
    ===========
    Device ID: 7
    Enclosure Index: 252
    Slot Number: 2
    LBA: 251972435
    
    
    seqNum: 0x00004f65
    Time: Wed Mar  6 05:36:48 2013
    
    Code: 0x00000071
    Class: 0
    Locale: 0x02
    Event Description: Unexpected sense: PD 07(e0xfc/s2) Path 4433221101000000, CDB: 28 00 0f 04 d1 f7 00 01 e0 00, Sense: 3/11/00
    Event Data:
    ===========
    Device ID: 7
    Enclosure Index: 252
    Slot Number: 2
    CDB Length: 10
    CDB Data:
    0028 0000 000f 0004 00d1 00f7 0000 0001 00e0 0000 0000 0000 0000 0000 0000 0000 Sense Length: 18
    Sense Data:
    00f0 0000 0003 000f 0004 00d2 0046 000a 0000 0000 0000 0000 0011 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
    
    seqNum: 0x00004f64
    Time: Wed Mar  6 05:36:43 2013
    
    • 2

相关问题

  • Windows 文件服务器性能调优

  • SSD TRIM 的硬件 RAID 控制器支持

  • 了解磁盘队列长度

  • 使用混合磁盘突袭 0?

  • Windows Server 2008 Hyper-V 虚拟化服务器的最佳 RAID 配置?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve