我们有 8 台 Cisco 服务器,其中 12 个用于数据的旋转磁盘和 2 个用于操作系统的 SSD。这 2 个 SSD 位于 Linux 软件 raid 1 中。这些 SSD 的磨损指示器均为个位数,其中一些达到 1 的值已发生故障。我正在将它们全部从备件中更换(这是一个漫长而烦人的过程),但我注意到磨损指标每周下降 1% 或 2%(我没有进行精确测量)。这些服务器上运行着一个应用程序,供应商给了我一些模糊的想法,但我确实需要找到它正在写入的目录。这样我就可以真正突出问题并敦促供应商进行修复。我搜索了一些,但没能找到太多。例如,iotop 显示完整磁盘吞吐量,包括 12 个旋转磁盘。操作系统是Redhat 7.9
回答一些问题:
- 磁盘为“480GB 2.5 英寸企业价值 6Gb SATA SSD”
- 产品 ID 为“UCS-SD480GBKS4-EB”
- 2018 年服务器标配磁盘
- 最近磨损似乎加速了(我现在正在记录磨损情况,所以几天后就会有更好的答案)
- 我已经用几年后购买的相同磁盘替换了大多数磁盘。
- iotop 显示稳定的 8MB/s 写入速度。
- 该系统在 8 台服务器上运行 hadoop。hadoop 文件系统位于旋转磁盘上,因此不应接触 SSD
- 根据供应商的建议,我已经大大减少了磁盘 IO,尽管它看起来仍然很高(8MB/s)