我有两台 HP DL380 G7 服务器 + P812 控制器 + D2700 机箱。它们是具有 144 Gb RAM 的数据库服务器。P812 固件为 6.40,D2700 为 0147
它们都与 18 OWC Mercury Extreme SSD (SATA) 配合得很好。在我在两个 D2700 机箱中再添加 6 个 SSD 以在每个机箱中制作 24 个 SSD 之后,其中一个服务器的磁盘性能与升级前的状态和另一台服务器相比非常差。
所以我怀疑添加到性能较差的服务器的 6 个 SSD 中的一个有故障。但是哪一个?HP Arrays Configuration Utility 未显示任何问题,POST 时也未出现任何问题。即使是长的 ACU 报告也没有显示任何内容。
所以我想看看这些驱动器的 SMART 属性,看看我是否能找出失败的那个。是否有 Windows 工具可以让我查看此配置中的 SMART 属性?
在一个非常相似的问题中,HP Proliant 服务器中的第 3 方 SSD 驱动器 - 监控驱动器运行状况建议使用 smartmontools 中的 smartctl。不幸的是,我没有看到 P812+D2700 背后的 SSD - 我怎样才能让 smartctl 工作?
C:\Program Files\smartmontools\bin>smartctl -a /dev/sdc,0 -T permissive -s on
smartctl 6.3 2014-06-23 r3922 [x86_64-w64-mingw32-2012r2] (cf-20140623)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: HP
Product: LOGICAL VOLUME
Revision: 6.40
User Capacity: 5,760,841,244,672 bytes [5.76 TB]
Logical block size: 512 bytes
Rotation Rate: 15000 rpm
Logical Unit id: 0x600508b1001cf0ebb14e9131d7XXXXXX
Serial number: PAGXQ0ARXXXXXX
Device type: disk
Local Time is: Fri Dec 12 18:42:32 2014 EST
SMART support is: Unavailable - device lacks SMART capability.
=== START OF ENABLE/DISABLE COMMANDS SECTION ===
unable to fetch IEC (SMART) mode page [Input/output error]
=== START OF READ SMART DATA SECTION ===
Error Counter logging not supported
Device does not support Self Test logging
这是非常相似的问题所建议的命令的输出(我将 /dev/sda 更改为 /dev/sdc,因为这是 P812 上第一个卷的设备:
C:\Program Files\smartmontools\bin>smartctl -a -l ssd /dev/sdc -d sat+cciss,1
smartctl 6.3 2014-06-23 r3922 [x86_64-w64-mingw32-2012r2] (cf-20140623)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
/dev/sdc: Type 'sat+...': Unknown device type 'cciss,1'
=======> VALID ARGUMENTS ARE: ata, scsi, sat[,auto][,N][+TYPE], usbcypress[,X], usbjmicron[,p][,x][,N], usbsunplus, areca,N[/E], auto, test <=======
使用 smartctl -h 获取使用摘要
请提供详细说明您的预期和实际绩效数据的数字。
另外,什么是 SAS 拓扑?主机和 D2700 JBOD 之间有多少条 SFF-8088 电缆?
正如我之前提到的,HP StorageWorks D2700具有 SMART 意识,并报告SCSI 机箱服务(SES) 详细信息……但您的用例范围很窄。扩展器上有很多 SATA 驱动器。我们知道 SATA 超时可能会导致共享扩展器背板(例如 D2700 中的背板)的性能问题。然而,这更有可能是一个旋转的媒体问题。SSD 不是问题。
根据我的经验,SSD 要么工作要么不工作。中间没有太多(除非你达到了写入耐力限制)。所以我要看的是:
由于空间不足,您扩展了阵列。在扩展之前,您的空间究竟有多少?我希望你没有用尽空间。想想 SSD 和该控制器上缺乏 TRIM 支持。
我会建议对这些驱动器进行配置不足或限制逻辑驱动器大小以解决缺少的 TRIM 功能。
更新您的固件。您正在使用不受支持的 D2700 机箱固件版本(已召回),并且您的 RAID 控制器也落后了。在撰写本文时,0149 是正确的 D2700 固件,您的控制器应该是6.60 版本。也升级主机。
也许是时候加强你的游戏了。超额订阅总线(RAID 控制器和 JBOD 背板)上的 24 个消费级 SATA SSD,其中 6Gbps SATA 驱动器降档至 3Gbps,这意味着您也达到了硬件的上限。Smart Array P812 控制器在大约 6 个磁盘时的 SSD IOPS回报递减。
这是原始问题的答案,要求使用Windows工具查看 D2700 机箱上 HP SmartArray P812 后面的 SSD 上的 SMART 参数:
截至 2017 年 8 月 29 日,我已经编辑了答案。最初我得出的结论是,没有基于 Windows 的工具允许我使用 P812 控制器查询 D2700 机箱中 SATA 驱动器上的 SMART 参数,我看到这是不完全准确。虽然 HP 阵列配置实用程序 (ACU) 不允许我查询SMART 参数,但它确实会在预测驱动器即将发生故障时通知我,并且此通知也会出现在阵列诊断报告中。
截至最初回答时,我考虑了这三位候选人,但当时他们都没有完成这项工作。下面的评论可能不再准确: