我们在 SAN 中运行 SSD 阵列,性能非常好。但是我们需要监控写入耐久性 SMART 属性,以便我们可以确定驱动器何时接近磨损。我们测试了这些驱动器并确认我们可以获取该数据,但没有在 SAN 中尝试。现在我们发现我们的 SAN(戴尔 PowerVault)没有任何方法可以查询 SMART 数据。它所做的只是查询一些属性本身并生成报告。该报告不包含我们需要的属性。
有什么方法可以访问我们驱动器的 SMART 数据,而无需将它们从阵列中取出并将它们放入另一台机器中以读取数据?
我们在 SAN 中运行 SSD 阵列,性能非常好。但是我们需要监控写入耐久性 SMART 属性,以便我们可以确定驱动器何时接近磨损。我们测试了这些驱动器并确认我们可以获取该数据,但没有在 SAN 中尝试。现在我们发现我们的 SAN(戴尔 PowerVault)没有任何方法可以查询 SMART 数据。它所做的只是查询一些属性本身并生成报告。该报告不包含我们需要的属性。
有什么方法可以访问我们驱动器的 SMART 数据,而无需将它们从阵列中取出并将它们放入另一台机器中以读取数据?
一般来说,这是由存储的固件管理的。这也不是您的问题,因为如果 SSD 发生故障,无论您如何使用它,它都会被供应商更换。
您不走运直接查询它们。您的 SAN 设备将需要以某种方式(SNMP 或某些专有监控接口)提供该数据。
我同意让存储阵列处理这个问题的观点。关于如何维护和管理 SSD 存储存在很多误解...
在这种情况下,将它们视为磁盘。
无需抢先更换 SSD。如果您的写入负载确实很重,那么您还应该使用针对该工作负载进行了优化的 SSD。他们存在!
企业 SAS SSD 可以通过 RAID 控制器或 SAN 报告的示例:
MD3620f 不通过模块化磁盘存储管理器 SMcli 提供此信息,它甚至也不在任何支持包文件中包含 SMART 数据。
在不移除驱动器的情况下获取 SMART 数据的唯一希望是通过 SNMP 轮询,因为这往往会抓取可能从机箱中的每个组件中提取的任何数据。如果 SNMP 没有为您提供数据,那么控制器固件可能根本不会从 SATA 磁盘中提取 SMART 数据。
资料来源:作为支持戴尔 MD3 系列阵列的高级工程师的第一手经验
编辑:ewwhite 也提出了一个很好的观点——没有真正需要主动监控这个阵列中的 SSD,除非你继续使用它超过它的使用寿命或没有保修范围(在这种情况下,这个数据至少会“得心应手”)。如果您使用 SSD 进行缓存,则无需担心。SSD 故障可能会对性能产生轻微影响,但在保修更换后,一切都会如新。如果您将 SSD 用作磁盘组的一部分(不使用较新的 SSD 缓存或磁盘池功能),请考虑使用 RAID6,这样您就不必担心任何高级别风险。