尽管在网上对这个主题进行了相当多的研究(公平地说,我不是全职系统管理员),但我无法弄清楚这一点。
我们有一堆 VMWare ESXi 5.5 服务器,其中一些集成到 vSphere 中,而另一些则没有(出于成本原因)。
它们都运行标准的 ESXi 映像,除了一台实际运行 DELL VMWare ESXi 映像的机器。
我想要完成的事情似乎很简单:配置系统以便可以通过 SNMP 从远程主机查询它,无论是 snmpwalk、Nagios、PRTG 等。我想查看来自温度传感器、已安装磁盘及其状态的信息, 风扇转速, PSU 状态等
我的印象是从 DELL 安装 VMWare 版本会自动启用必要的模块(最重要的是 OpenManage),但情况似乎并非如此。
我有相互矛盾的信息,这是否可能,一些文件说你不能通过 SNMP 查询 DELL VMWare ESXi 服务器,你需要使用 CIM 客户端。然后是可以安装的 OMSA VIB,等等。
我想这是一个相当普遍的要求,但是可用的文档在所有不同的方向上都拉动了一个。
我正在尝试做的事情(没有完整的 vSphere 环境)是否可能?
是的,您可以使用任何 SNMP 监控软件监控独立 ESXi 主机,但某些项目可能只能使用支持 CIM 协议的监控工具才能看到。
我所有的 ESXi 主机都是 vCenter 的一部分,但我们使用 SolarWinds NPM 直接监控它们(使用 vmkernal 主机 IP 地址)。ESXi 5.5 中内置了 5 或 6 个 CIM 模块,可为您提供硬件健康状况,但 RAID 卡健康状况不是其中之一。您将需要添加 Dell OMSA VIB,以添加其他 CIM 代理,包括用于 RAID 阵列的代理。Brian Atkinson 的帖子仍然是我发现的最好的描述该过程的帖子,
https://communities.vmware.com/people/vmroyale/blog/2012/07/26/how-to-use-dell-dset-with-esxi
如果您要使用提供历史信息并发出警报的第三方监控工具,则只需按照安装 OMSA ESXi VIB 的说明进行操作。如果您希望使用 Dell OMSA 服务器,您可以将其远程安装在裸机服务器上、远程安装在 VM 中或作为 VM 本地安装。
在 ESXi 主机上安装 OMSA VIB 后,您可以使用 OMSA 服务器连接到 DRAC 和 iDRAC 带外 (OOB/IPMI/iLo) 管理卡或 ESXi 主机。您不会在 DRAC 或 iDRAC 中看到 RAID 运行状况信息 - 仅在将 OMSA 服务器连接到 ESXi 主机时 - 我重复了 Server 关键字,因此充当 OMSA VIB 客户端的服务器之间没有混淆安装在 ESXi 主机上。
一些有用的资源:
显示 ESXi 主机上的当前 CIM 提供程序 https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2053715
从主机的 CLI 显示 ESXi 主机上当前安装的 VIB,
esxcli software vib list
当您直接连接到 vCenter 服务器而不是 ESXi 主机时,您确实会看到一些额外的硬件健康状况细节,但通常如果您在配置/健康状况面板中没有看到您正在寻找的硬件健康状况,那么您缺少 CIM 提供程序并且您需要在 ESXi 主机上找到并安装 VIB。将 Dell OMSA VIB 添加到 ESXi 主机时,您会看到存储传感器添加到运行状况页面,该页面显示存储控制器的 RAID 卷、驱动器、控制器和电池运行状况。您可能需要重置传感器才能显示它,有时在第一次安装 VIB 并重新引导 ESXi 主机后需要 15 到 20 分钟。
如果您在连接 vSphere Client 时未在 ESXi 主机的“健康状态”页面上看到传感器,那么您在使用监控软件远程轮询传感器时很可能不会看到它。
此外,您应该注意,并非所有服务器都具有相同的传感器,并且您可能无法从所有服务器获得相同的健康状态,具体取决于服务器硬件、RAID 卡和可用于组合的 CIM 版本。您可能还需要升级或更改 RAID 卡的 VIB 才能使健康状态正常工作。CIM 提供程序(在本例中为 OMSA VIB)通过设备 VIB(实际设备驱动程序)与硬件通信,并将此信息传递给 ESXi 主机上的 CIM 代理 - 也称为小占用 CIM 代理守护程序 ( sfcbd)。当您使用强大的监控软件轮询 ESXi 主机的硬件运行状况时,它将使用 SNMP 查询获取一些信息,一些使用 CIM,一些使用 ESXi API(它们是 SOAP 请求)。CIM 客户端与 ESXi 主机上的 sfcbd 进程对话。
有时 CIM 进程会停止工作。发生这种情况时,您将在 ESXi 主机上重新启动 sfcbd-watchdog 进程。这将重新启动 sfcbd 服务,并且 CIM 轮询将再次起作用。从主机的 CLI,
/etc/init.d/sfcbd-watchdog restart
我认为这涵盖了让你跑步所需的大部分项目。
我明白你在找什么;有关如何管理和监控独立 VMware ESXi 主机运行状况的具体说明。
在实践中,方法应该略有不同。我将解释我如何管理主机。
在您有多个受 vCenter 管理的 ESXi 主机的情况下,假设您利用 vCenter 进行监控和运行状况状态,而不是查询各个主机。我在 vCenter 中配置了一个包罗万象的警报,以在“主机硬件运行状况”上发出警报。我通常不在乎它是电源、RAM、磁盘还是任何其他组件,而是主机不健康。
监控独立的 ESXi 主机不会很有帮助,因为 Dell/HP 驱动程序的目的是向 vCenter 公开信息。而且我不认为以这种方式查询单个主机是最佳实践。当然,这是因为理想情况下您希望集中管理您的 VM 主机。
如果您使用单个主机运行 vCenter,您将获得此功能,因此这可能是您的环境的一个选项。
如果您需要某种带外监控,您不能改为查询 DRAC 吗?
您可以使用出色的https://exchange.nagios.org/directory/Plugins/Operating-Systems/*-Virtual-Environments/VMWare/check_vmware_api/details(有或没有 nagios),它利用 vmware api 获取所有硬件监控所需的信息:
您需要 perl vmware sdk,但除此之外它非常简单。它适用于所有类型的硬件(只要 vmware api 看到传感器,就会检查它们)。
试试 zabbix ( http://zabbix.com ):
1)它是完美的、知名的世界级监控软件
2) 您可以轻松开始使用 Zabbix 设备,该设备也可作为预配置的虚拟映像(基于 OpenSuSE)使用。
3) 它可以使用 Vmware Web 服务(如 web-client)监控 ESX[I] 主机和机器。您可以使用低级发现规则自动发现 VMware 管理程序和虚拟机,并根据预定义的主机原型创建主机来监控它们。
4) 您将能够通过 iDrac 使用 SNMP 监控戴尔服务器的整个硬件,包括 RAID 控制器及其卷状态、物理磁盘/内存模块/PSU 等...
所有类型的硬件状态信息 [在 iDrac 中可用] 都可以通过 SNMP 访问(至少在带有 IDrac 7/8 的服务器上 - 我已经为我的公司实施了对 50 多台戴尔 12/13 代服务器的硬件监控方法)。
借助zabbix完美的LLD(low-level-discovery)功能,您可以轻松收集所有硬件组件进行监控,无需手动枚举,并自动创建监控项(状态、温度、风扇速度、磁盘大小和序列号等)、触发器(处理监控数据的表达式)和各种动作......