AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 10867
Accepted
Garry Harthill
Garry Harthill
Asked: 2009-05-22 08:38:09 +0800 CST2009-05-22 08:38:09 +0800 CST 2009-05-22 08:38:09 +0800 CST

监控 HP DL 服务器上的硬件故障

  • 772

除了 HP 提供的工具之外,是否还有其他工具可以从 RHEL5 监视这些服务器中的组件故障?

hardware linux monitoring rhel5
  • 3 3 个回答
  • 2780 Views

3 个回答

  • Voted
  1. Chopper3
    2009-05-22T08:56:21+08:002009-05-22T08:56:21+08:00

    HP 的硬件挂钩本身是专有的,但它们确实通过许多“开放”方法(例如 SNMP/WMI/WBEM 等)公开了它们的工具。因此您不必使用 SIM/SMHP。

    • 2
  2. Best Answer
    gharper
    2009-05-22T08:57:12+08:002009-05-22T08:57:12+08:00

    HP ASM 工具和 SNMP OID 是我们主要用于一般组件监控的工具......

    或者,您也可以使用smartmontools监控磁盘驱动器,大多数传感器应该显示在lm_sensors

    • 2
  3. carlito
    2009-06-05T21:09:12+08:002009-06-05T21:09:12+08:00

    您应该安装 HP 的全套工具、hpasm/hprsm 软件包等。它们确实是我见过的最难安装的软件包。似乎它们是由不关心易于部署的人编写的。他们提供了一个您可以手动运行的 shell 脚本,首先使用它,直到您弄清楚如何破解该脚本、编写包装器、单独安装 RPM,或者精简或供应商以合理行事。

    您应该监视 syslog 中这些工具的错误。

    您应该解析 hpasmcli (show server, show dimm) 和 hpacucli (controller all show, then for each controller slot=X pd all show) 输出以识别故障。如果你依赖 syslog 报告,你会错过失败并有令人尴尬的灾难。

    您还应该解析 hplog 输出,并在检查后清除输出,将此输出存档到某处。认为这是对 hpasmcli/hpacucli 检查的冗余检查。

    您应该使用 hponcfg 来确保 ILO 已配置,并连接到它以确保它实际上是响应式的。

    确保您可以升级固件,并定期这样做。HP 发布了关键的固件升级,例如,将由轻微内存错误导致的崩溃而不识别坏 DIMM 转变为故障灯。当并非绝对需要升级固件时,HP 改变了我对升级固件的看法。(嗯,这是绝对必要的,只是没有人告诉你)。

    放弃 SNMP 的东西。您有很多工作要做,这只是额外的工作,不会为您提供所需的全部功能,因此您仍然需要完成其他工作。

    在报告/管理硬件问题方面,惠普服务器仍然是最好的英特尔服务器。他们只是有一些非常烦人的问题。也许如果每个客户都至少抱怨一次,他们将使部署更容易。这没有任何借口。

    运行 RHEL5 并持续监控 HP 管理工具以及偶尔对磁盘和内存进行压力测试的 DL3[68]0 G5 将是市场上最可靠的英特尔解决方案。只要尽你的努力,以确保你得到你的钱是值得的。HP 为您提供了这些工具,但它们并没有让它们像应有的那样易于使用。

    仅使用 HP RAM。否则就不值得麻烦了。当 DIMM 出现故障时,您不需要供应商互相指责。

    定期对故障灯进行数据中心演练,并使用它来纠正监控脚本中的故障。这就是我了解到 syslog 几乎没有用的原因,您必须定期检查 hpasmcli/hpacucli。

    • 1

相关问题

  • 更改 PHP 的默认配置设置?

  • 你用什么工具来监控你的服务器?

  • 我应该如何管理每用户带宽?

  • 保护新的 Ubuntu 服务器 [关闭]

  • (软)Ubuntu 7.10 上的 RAID 6,我应该迁移到 8.10 吗?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    Windows 中执行反向 DNS 查找的命令行实用程序是什么?

    • 14 个回答
  • Marko Smith

    如何检查 Windows 机器上的端口是否被阻塞?

    • 4 个回答
  • Marko Smith

    我应该打开哪个端口以允许远程桌面?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    kch 如何更改我的私钥密码? 2009-08-06 21:37:57 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve