我有一台 Windows 服务器(2022),配有两块 2TB 的三星 990 Pro SSD。我遇到了一些奇怪的问题,其中一个会不时消失。每隔 2 个月左右,有问题的磁盘就不再存在:diskpart
或者Get-PhysicalDisk
(在 PS 中)根本不再列出该磁盘。那时唯一能做的就是完全关闭电源并重新启动,简单地在操作系统中重新启动是不够的。
起初我以为是主板的问题,所以我联系了制造商,结果他们告诉我要确保不是磁盘的问题。经过反复考虑,我决定研究磁盘的潜在问题,以避免更换主板的麻烦,否则问题仍然存在。
检查磁盘的情况并不容易,因为这是 Server Core 安装,所以没有 GUI,但我能够进行一些分析,结果令人震惊:运行 MS 的 diskspd 显示两个磁盘的性能都非常糟糕。读写速度都略低于 50MiB/s,远低于 990 Pro 的规格。
所以我现在有几个问题:
- 这两个问题(磁盘时不时消失)有关联吗?
- 速度问题是否是由主板(ASRock X570S PG Riptide)引起的?
- 难道这些 SSD 是假货?我该如何检查?
- 对于进一步分析这一点有什么建议吗?
澄清:
- 服务器日志:事件查看器中未显示任何内容
- 硬盘使用年限:已使用一年,且未频繁使用
- 智能读数:这是我从 Samsung DC Toolkit 获得的输出:
磁盘编号:1:c | 型号名称:Samsung SSD 990 PRO 带散热器 2TB | 固件版本:0B2QJXG7
字节 | 描述 | 价值 |
---|---|---|
0 | 严重警告 | 0x00 |
2:1 | 复合温度 | 0x0142 |
3 | 可用备件 | 0x64 |
4 | 可用备用阈值 | 0x0A |
5 | 使用百分比 | 0x02 |
47:32 | 读取的数据单元 | 0x00000000000000000000000000011BD521 |
63:48 | 写入的数据单元 | 0x00000000000000000000000000010D94FB |
79:64 | 主机读命令 | 0x000000000000000000000000000DD8604F |
95:80 | 主机写命令 | 0x0000000000000000000000000001282EACA |
111:96 | 控制器繁忙时间 | 0x000000000000000000000000000000009963 |
127:112 | 电源循环 | 0x0000000000000000000000000000000020 |
143:128 | 通电时间 | 0x0000000000000000000000000000001F93 |
159:144 | 不安全停机 | 0x0000000000000000000000000000000014 |
175:160 | 介质和数据完整性错误 | 0x00000000000000000000000000000000 |
191:176 | 错误信息日志条目数 | 0x00000000000000000000000000000000 |
195:192 | 警告复合温度时间 | 0x00040880 |
199:196 | 临界复合温度时间 | 0x00000000 |
201:200 | 温度传感器1 | 0x0142 |
203:202 | 温度传感器2 | 0x0149 |
205:204 | 温度传感器3 | 0x0000 |
207:206 | 温度传感器 4 | 0x0000 |
209:208 | 温度传感器 5 | 0x0000 |
211:210 | 温度传感器 6 | 0x0000 |
213:212 | 温度传感器 7 | 0x0000 |
215:214 | 温度传感器 8 | 0x0000 |