我有一台定制的电脑(由多个组件组装而成,但不是我做的)。硬件规格如下:
- 中央处理器:AMD Ryzen 5 1600
- 内存:16GB DDR4(2x8GB)/ 2400 MHz
- 显卡:NVIDIA GeForce RTX 2060
- 固态硬盘:东芝 TR200 240GB
- 硬盘:希捷 1TB
系统频繁且随机地崩溃 - 有时是在玩游戏时,有时是在浏览 Google 时,甚至是在将文件从一个位置复制到另一个位置时。
我使用 WinDbg 分析了 Windows 的崩溃转储,大多数都指向与 NVIDIA GPU 或其驱动程序相关的问题。然而,有些也表明 SSD 可能存在问题。为了排除磁盘相关问题,我运行了 CrystalDiskInfo,SSD 和 HDD 看起来都状况良好。
为了进一步调查,我尝试从 USB 驱动器启动多个 Linux Live 发行版,但它们也全部崩溃,导致内核崩溃。崩溃中列出的受影响模块各不相同,包括 NVIDIA 驱动程序、声卡驱动程序、Wi-Fi 驱动程序等。即使在执行简单任务(例如复制文件或仅仅打开终端而不执行任何命令)时,Linux 也会出现崩溃。
Linux 经常会报告诸如“Linux 看门狗错误:软锁定 CPU# 卡住 X 秒”之类的错误,并且每次崩溃后都会引用主板及其版本:Micro-Star International M5-7A38 B450M PRO-VDH MAX,日期为 2019 年 7 月 11 日。
PC 没有过热,即使启动到启用故障安全模式的 Linux 实时环境,崩溃问题仍然存在。值得注意的是,系统不会突然关机或重启——它只是崩溃,显示内核崩溃(Linux 系统)或蓝屏(Windows 系统)。
下一步,我计划更新 BIOS,断开 SSD 和 HDD 的连接,然后安装新的 NVMe SSD,并全新安装 Windows 11。可惜的是,我无法移除 NVIDIA GPU,因为系统没有集成显卡。除此之外,我不确定还要测试什么,因为崩溃似乎毫无关联,也没有明确的规律。
您对导致此问题的原因有何见解?您建议采取哪些额外的故障排除步骤?
更新:很多人认为问题可能与内存有关。我运行了 MemTest86+,但没有检测到任何错误。为了确保万无一失,我又运行了几次。此外,我启动了一个比之前测试的两个版本更新的 Linux Live 环境(Kubuntu 24.04),也没有遇到任何崩溃。但是,由于崩溃完全是随机的,这可能只是巧合。为了确认,我正常使用系统,执行了各种任务,系统并没有崩溃。
我打算测试另一块显卡并更新BIOS。很遗憾,我无法测试其他CPU或电源。BIOS中,所有超频设置(包括时序调整)都恢复了默认设置。目前似乎没有任何正在进行的超频。
最终更新:问题出在内存上,就像很多人在这里说的那样。我运行了 memtest86+,结果显示错误超过 25000 条。经过一些测试后,我终于找到了导致问题的插槽,并更换了它。之后,我的 BIOS 又出现了一个无关的问题,所以我没能完成所有测试并告诉你我的答案是否正确,但最终它终于可以正常工作了。非常感谢。