AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 1172216
Accepted
gwyers
gwyers
Asked: 2025-02-04 19:20:22 +0800 CST2025-02-04 19:20:22 +0800 CST 2025-02-04 19:20:22 +0800 CST

三星 SSD 问题(带散热器的 990 PRO)

  • 772

我有一台 Windows 服务器(2022),配有两块 2TB 的三星 990 Pro SSD。我遇到了一些奇怪的问题,其中一个会不时消失。每隔 2 个月左右,有问题的磁盘就不再存在:diskpart或者Get-PhysicalDisk(在 PS 中)根本不再列出该磁盘。那时唯一能做的就是完全关闭电源并重新启动,简单地在操作系统中重新启动是不够的。

起初我以为是主板的问题,所以我联系了制造商,结果他们告诉我要确保不是磁盘的问题。经过反复考虑,我决定研究磁盘的潜在问题,以避免更换主板的麻烦,否则问题仍然存在。

检查磁盘的情况并不容易,因为这是 Server Core 安装,所以没有 GUI,但我能够进行一些分析,结果令人震惊:运行 MS 的 diskspd 显示两个磁盘的性能都非常糟糕。读写速度都略低于 50MiB/s,远低于 990 Pro 的规格。

所以我现在有几个问题:

  • 这两个问题(磁盘时不时消失)有关联吗?
  • 速度问题是否是由主板(ASRock X570S PG Riptide)引起的?
  • 难道这些 SSD 是假货?我该如何检查?
  • 对于进一步分析这一点有什么建议吗?

澄清:

  • 服务器日志:事件查看器中未显示任何内容
  • 硬盘使用年限:已使用一年,且未频繁使用
  • 智能读数:这是我从 Samsung DC Toolkit 获得的输出:

磁盘编号:1:c | 型号名称:Samsung SSD 990 PRO 带散热器 2TB | 固件版本:0B2QJXG7

字节 描述 价值
0 严重警告 0x00
2:1 复合温度 0x0142
3 可用备件 0x64
4 可用备用阈值 0x0A
5 使用百分比 0x02
47:32 读取的数据单元 0x00000000000000000000000000011BD521
63:48 写入的数据单元 0x00000000000000000000000000010D94FB
79:64 主机读命令 0x000000000000000000000000000DD8604F
95:80 主机写命令 0x0000000000000000000000000001282EACA
111:96 控制器繁忙时间 0x000000000000000000000000000000009963
127:112 电源循环 0x0000000000000000000000000000000020
143:128 通电时间 0x0000000000000000000000000000001F93
159:144 不安全停机 0x0000000000000000000000000000000014
175:160 介质和数据完整性错误 0x00000000000000000000000000000000
191:176 错误信息日志条目数 0x00000000000000000000000000000000
195:192 警告复合温度时间 0x00040880
199:196 临界复合温度时间 0x00000000
201:200 温度传感器1 0x0142
203:202 温度传感器2 0x0149
205:204 温度传感器3 0x0000
207:206 温度传感器 4 0x0000
209:208 温度传感器 5 0x0000
211:210 温度传感器 6 0x0000
213:212 温度传感器 7 0x0000
215:214 温度传感器 8 0x0000
hyper-v
  • 3 3 个回答
  • 142 Views

3 个回答

  • Voted
  1. NISMO1968
    2025-02-06T20:26:40+08:002025-02-06T20:26:40+08:00

    更新至最新固件。如果您的驱动器继续出现故障,如出现性能不佳、消失和/或退出系统,则只需将其 RMA 即可。

    • 2
  2. Best Answer
    telcoM
    2025-02-06T16:43:23+08:002025-02-06T16:43:23+08:00

    三星 SSD 990 PRO 系列的当前固件版本似乎是 4B2QJXD7。显然,早于 1B2QJXD7 的固件版本有一个相当严重的错误,会严重损害 SSD 的使用寿命:

    https://www.tomshardware.com/news/samsung-990-pro-health-dropping-fast

    https://www.tomshardware.com/news/samsung-990-pro-firmware-update-released-ssd-health

    https://www.youtube.com/shorts/D7XgEfxPGuo

    https://www.reddit.com/r/hardware/comments/10jkwwh/samsung_990_pro_ssd_with_rapid_health_drops/

    至少在版本 1B2QJXD7 中提供初始修复时,它阻止了驱动器的恶化,但并没有修复更新前已经发生的退化。较新的固件版本可能提供了更精细的修复,但不幸的是三星显然没有公布太多细节。

    据我所知,您的固件版本 0B2QJXG7 可能受到此错误的影响,而且您的 SSD 似乎确实严重退化。您可能应该尽快更新固件,并尝试联系三星支持以获得可能的 RMA,因为这似乎是一个已知问题。

    • 0
  3. gwyers
    2025-02-07T19:46:22+08:002025-02-07T19:46:22+08:00

    我有几项发现需要报告:

    • 我在 diskspd 命令行中犯了一个愚蠢的错误。这解释了速度读数低的原因。
    • 我能够重现“磁盘消失”问题,并且现在可以从事件查看器中找到痕迹。
    • 固件似乎确实是罪魁祸首。

    我所做的是,我从服务器上移除 SSD,然后将它们插入安装了普通 Windows 10 的机器中。这样我就可以使用 GUI,并允许我运行 Samsung Magician 和其他一些磁盘基准测试工具。它们都显示大约 6500 MB/s 的连续读取速度和略低的写入速度。我花了一些时间来理解磁盘插入服务器时从 diskspd 命令行获得的读数。修复该问题后,我在服务器本身上得到了类似的读数。解决了这个问题后,剩下的问题是我是否应该担心 6500 MB/s 的测量速度和 7450 MB/s 的三星官方速度之间的差距。目前,我决定将其归入营销宣传类别。

    在 Samsung Magician 中,它提示我升级固件(根据 telcoM 的建议,从 0B2QJXG7 升级到 4B2QJXD7)。我觉得这是一个好主意,但又不想冒数据丢失的风险,所以我开始将驱动器中的内容复制到该 PC 上的另一个位置。所有文件都是 Hyper-V VHD,因此相当大。复制从 200GB 虚拟磁盘开始,大约一分钟后中断,出现了与我之前看到的行为相同的行为:磁盘不再存在:diskpart 看不到它,唯一能做的就是完全关闭电源并重新启动,简单地在操作系统中重新启动是不够的。

    知道了发生这种情况的确切时间后,我详细查看了事件查看器,在那里我可以看到整个事件发生的顺序。我之前没有看到它的原因是,其中大部分内容都记录为警告:

    • 它以来自 stornvme 的事件 ID 为 129 的警告开始:“已发出重置设备 \Device\RaidPort2 的命令”。
    • 随后会出现一系列事件 ID 为 51 的警告:“分页操作期间,在设备 \Device\Harddisk1\DR1 上检测到错误。”
    • 经过几次这样的尝试(我想是重试)后,NTFS 会发出警告(不是错误!),事件 ID 为 50:“{延迟写入失败} Windows 无法保存文件 XYZ 的所有数据。数据已丢失。此错误可能是由您的计算机硬件或网络连接故障引起的。请尝试将此文件保存到其他地方。”
    • 此模式重复一次或两次,导致 stornvme 出现错误,事件 ID 为 11:“驱动程序在 \Device\RaidPort2 上检测到控制器错误。”

    所以我继续升级固件。一切都很顺利,我尝试通过复制一些大文件来重现错误,现在错误似乎已经消失了。

    这一切都让我心里很不舒服:我以为这些都是高档驱动器,而且我付了高价。

    • 0

相关问题

  • Hyper-V 企业许可 - 包含的 CAL 是否应用于每个 VM 或每个 VM?[复制]

  • Hyper-V 和 Drobo Pro

  • 小型企业的服务器虚拟化/RAID 配置

  • 交换服务器 2003 在 hyper-v 上

  • 在同一台机器上将域控制器作为 1 个 VM 和一个 RODC 作为另一个 VM 运行,它会工作吗?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve