AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 589070
Accepted
Xianlin
Xianlin
Asked: 2014-04-16 00:51:27 +0800 CST2014-04-16 00:51:27 +0800 CST 2014-04-16 00:51:27 +0800 CST

如何使用 CentOS 6 监控 Dell PERC H710 Raid Controller 后面的硬盘状态?

  • 772

我有一台戴尔服务器CentOS 6使用PERC H710带有 Raid 5 设置的 Raid 控制器卡运行,我想监控 Raid 控制器后面的硬盘故障/工作状态。

然后我应该能够使用 bash 脚本来监控硬盘状态并在出现问题时发送警报电子邮件。

CentOS/Red Hat/Linux的LSI MegaRAID SAS命令工具(关于 LSI MegaRAID SAS Linux 工具)不支持 PERC H710,smartctl也不支持它。

根据戴尔网站,CentOS此服务器不支持 ( NX3200 PowerVault),我无法下载任何 linux 程序来监控硬盘。

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

任何人都知道如何使用 CentOS 6 在 Dell PERC H710 上监控硬件袭击背后的硬盘状态?

centos
  • 7 7 个回答
  • 153251 Views

7 个回答

  • Voted
  1. Jonathan Barber
    2014-07-11T02:30:30+08:002014-07-11T02:30:30+08:00

    您可以使用 smartctl 命令及其-d参数查看磁盘的 SMART 状态。例如,要查看阵列中的第一个磁盘:

    # smartctl -a /dev/sda -d sat+megaraid,00
    smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
    Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
    
    === START OF INFORMATION SECTION ===
    Device Model:     ST91000640NS
    Serial Number:    ........
    LU WWN Device Id: . ...... .........
    Firmware Version: AA08
    User Capacity:    1,000,204,886,016 bytes [1.00 TB]
    Sector Size:      512 bytes logical/physical
    Device is:        Not in smartctl database [for details use: -P     showall]
    ATA Version is:   8
    ATA Standard is:  ATA-8-ACS revision 4
    Local Time is:    Thu Jul 10 11:21:52 2014 WEST
    SMART support is: Available - device has SMART capability.
    SMART support is: Enabled
    
    === START OF READ SMART DATA SECTION ===
    SMART overall-health self-assessment test result: PASSED
    Warning: This result is based on an Attribute check.
    ...
    ...
    #
    

    这是在带有 smartmontools-5.43-1.el6.x86_64 的 Scientific Linux 6(另一个基于 RHEL6 的操作系统)上。

    • 31
  2. Best Answer
    ewwhite
    2014-04-16T05:58:06+08:002014-04-16T05:58:06+08:00

    SMART不是磁盘或存储监控的最终决定!它是一个组件,但现代 RAID 控制器将它与其他方法一起使用来确定驱动器和阵列的健康状况。

    我假设这是戴尔 PowerEdge 服务器中的 PERC 控制器。

    对戴尔硬件进行健康监测的正常 Linux 友好方法是通过 Yum 安装适用于 Linux 的戴尔 OMSA 代理 - http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup

    yum install srvadmin-all将安装全套代理。安装后,您可以使用该omreport命令获取有关您的阵列的信息。

    例子:

    $ omreport storage vdisk
    
    $ omreport storage pdisk controller=0
    
    $ omreport storage vdisk controller=0 vdisk=1
    
    • 27
  3. Mike S
    2016-04-06T11:57:47+08:002016-04-06T11:57:47+08:00

    接受的答案建议大胆的是yum install srvadmin-all。布莱奇。以下是如何使它稍微少一点 blecch-y (但仍然是 blecch-y ;您可以在 HP 的平台上变得更精简。但我离题了......)我的意思是,只安装那些在您的机器上管理存储所需的组件.

    顺便说一句,用户问题的直接答案在于下面列表中的“在 vdisk 0 上显示物理磁盘”项。

    wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
    bash bootstrap.cgi
    yum install srvadmin-base
    yum install srvadmin-storageservices
    

    添加到 root 的 .bashrc:

    export PATH=$PATH:/opt/dell/srvadmin/bin
    

    享受:

    RAID 命令

    • 显示控制器 0 上的所有物理磁盘

      $ omreport storage pdisk controller=0
      
    • 显示控制器 0 上的所有逻辑磁盘

      $ omreport storage vdisk controller=0
      
    • 显示 vdisk 0 上的所有物理磁盘

      $ omreport storage pdisk controller=0 vdisk=0
      
    • 将 vdisk 从 raid0 重新配置为 raid1(酷!!!!)

      $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
      
    • 在新磁盘上创建虚拟磁盘:

      $ sudo omconfig storage controller controller=0 action=clearforeignconfig
      $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
      

    更多信息

    • 如何在 Linux 下重新配置戴尔机器上的磁盘阵列?

    顺便说一句,由于这只不过是戴尔品牌的 LSI MegaCLI 卡,您可能会发现 Han Solo 的答案更好!然而,我还没有尝试过。

    甜蜜

    下面是 omreport 输出的一个示例,通过 grep 管道获取一组美味的数据:

    $ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
    List of Physical Disks belonging to root
    
    Controller PERC H700 Integrated (Embedded)
    ID                              : 0:0:0
    Status                          : Ok
    Name                            : Physical Disk 0:0:0
    State                           : Online
    Power Status                    : Spun Up
    Bus Protocol                    : SAS
    Media                           : HDD
    Failure Predicted               : No
    Revision                        : HT64
    T10 PI Capable                  : No
    Certified                       : Yes
    Encryption Capable              : No
    Capacity                        : 136.13 GB (146163105792 bytes)
    Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
    Available RAID Disk Space       : 0.00 GB (0 bytes)
    Hot Spare                       : No
    Vendor ID                       : DELL(tm)
    Product ID                      : ST9146852SS
    Serial No.                      : 6TB1AFDT
    Part Number                     : CN0X162K7262213800JTA01
    Negotiated Speed                : 6.00 Gbps
    Capable Speed                   : 6.00 Gbps
    Sector Size                     : 512B
    Manufacture Day                 : 05
    Manufacture Week                : 10
    Manufacture Year                : 2011
    SAS Address                     : 5000C500395E44C5
    
    ID                              : 0:0:1
    Status                          : Ok
    Name                            : Physical Disk 0:0:1
    State                           : Online
    Power Status                    : Spun Up
    Bus Protocol                    : SAS
    Media                           : HDD
    Failure Predicted               : No
    Revision                        : HT64
    T10 PI Capable                  : No
    Certified                       : Yes
    Encryption Capable              : No
    Capacity                        : 136.13 GB (146163105792 bytes)
    Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
    Available RAID Disk Space       : 0.00 GB (0 bytes)
    Hot Spare                       : No
    Vendor ID                       : DELL(tm)
    Product ID                      : ST9146852SS
    Serial No.                      : 6TB1AFEY
    Part Number                     : CN0X162K7262213800FPA01
    Negotiated Speed                : 6.00 Gbps
    Capable Speed                   : 6.00 Gbps
    Sector Size                     : 512B
    Manufacture Day                 : 05
    Manufacture Week                : 10
    Manufacture Year                : 2011
    SAS Address                     : 5000C500395E3C1D
    
    • 11
  4. Han Solo
    2016-02-16T17:15:43+08:002016-02-16T17:15:43+08:00

    我也在努力让它在 CentOS 中工作,我在这里找到了一个工作包http://mirror.ndchost.com/software/lsi/

    称为“ MegaCli-8.07.10-1.noarch.rpm ”

    命令参考http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

    我希望它有所帮助。

    • 7
  5. user311347
    2015-09-16T01:44:45+08:002015-09-16T01:44:45+08:00
    smartctl -d megaraid,00 -a /dev/sda
    Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
    Device: FUJITSU  MBE2147RC        Version: D906
    Serial number: xxxx
    Device type: disk
    Transport protocol: SAS
    Local Time is:
    
    • 3
  6. Steve Bonds
    2019-05-02T11:53:09+08:002019-05-02T11:53:09+08:00

    如果您问得好,该perccli命令还可以向您显示很多驱动器信息:

    # /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
    Controller = 0
    Status = Success
    Description = Show Drive Information Succeeded.
    
    
    Drive /c0/e32/s0 :
    ================
    
    -------------------------------------------------------------------------
    EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
    -------------------------------------------------------------------------
    32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
    -------------------------------------------------------------------------
    
    EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
    DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
    UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
    Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
    SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
    UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
    CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded
    
    
    Drive /c0/e32/s0 - Detailed Information :
    =======================================
    
    Drive /c0/e32/s0 State :
    ======================
    Shield Counter = 0
    Media Error Count = 0
    Other Error Count = 0
    Drive Temperature =  40C (104.00 F)
    Predictive Failure Count = 1
    S.M.A.R.T alert flagged by drive = Yes
    

    这需要为每个机箱插槽重复,或者至少我还没有找到一种方法可以使用单个perccli命令一次打印所有这些。

    与其他更全面的选项相比,它也易于安装:

    # curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
    # tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
    # cd Linux/
    # yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
    # cd /opt/MegaRAID/perccli/
    

    perccli不是像戴尔 OMSA 那样的综合监控套件,但听起来很多人不想要全面的东西,而是需要一个体面、简单的工具。

    • 2
  7. mike_coreit
    2016-08-14T06:08:55+08:002016-08-14T06:08:55+08:00

    您好我有一个类似的戴尔 PERC/LSI 卡,我需要检查 RAID 状态。LSI 有一个名为 sas2ircu 的实用程序,我发现它非常有用,还有一个适用于 Windows 和 Linux 的版本。

    • -1

相关问题

  • 如何在 Linux 机器上找到有关硬件的详细信息?

  • 使用 crontab 和 /etc/cron.hourly,daily,weekly 的区别

  • 持续监控许多服务器运行状况的简单方法?

  • Hudson 无法在 tomcat5 中启动

  • CentOS 的依赖挑战

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve