AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / computer / 问题 / 1888454
Accepted
m0rningst4r
m0rningst4r
Asked: 2025-03-25 21:40:20 +0800 CST2025-03-25 21:40:20 +0800 CST 2025-03-25 21:40:20 +0800 CST

为什么我的电脑系统会频繁随机崩溃?可能是什么原因造成的?

  • 772
这个问题是从 Server Fault迁移过来的,因为可以在超级用户那里找到答案。 迁移时间: 18 天前。

我有一台定制的电脑(由多个组件组装而成,但不是我做的)。硬件规格如下:

  • 中央处理器:AMD Ryzen 5 1600
  • 内存:16GB DDR4(2x8GB)/ 2400 MHz
  • 显卡:NVIDIA GeForce RTX 2060
  • 固态硬盘:东芝 TR200 240GB
  • 硬盘:希捷 1TB

系统频繁且随机地崩溃 - 有时是在玩游戏时,有时是在浏览 Google 时,甚至是在将文件从一个位置复制到另一个位置时。

我使用 WinDbg 分析了 Windows 的崩溃转储,大多数都指向与 NVIDIA GPU 或其驱动程序相关的问题。然而,有些也表明 SSD 可能存在问题。为了排除磁盘相关问题,我运行了 CrystalDiskInfo,SSD 和 HDD 看起来都状况良好。

为了进一步调查,我尝试从 USB 驱动器启动多个 Linux Live 发行版,但它们也全部崩溃,导致内核崩溃。崩溃中列出的受影响模块各不相同,包括 NVIDIA 驱动程序、声卡驱动程序、Wi-Fi 驱动程序等。即使在执行简单任务(例如复制文件或仅仅打开终端而不执行任何命令)时,Linux 也会出现崩溃。

Linux 经常会报告诸如“Linux 看门狗错误:软锁定 CPU# 卡住 X 秒”之类的错误,并且每次崩溃后都会引用主板及其版本:Micro-Star International M5-7A38 B450M PRO-VDH MAX,日期为 2019 年 7 月 11 日。

PC 没有过热,即使启动到启用故障安全模式的 Linux 实时环境,崩溃问题仍然存在。值得注意的是,系统不会突然关机或重启——它只是崩溃,显示内核崩溃(Linux 系统)或蓝屏(Windows 系统)。

下一步,我计划更新 BIOS,断开 SSD 和 HDD 的连接,然后安装新的 NVMe SSD,并全新安装 Windows 11。可惜的是,我无法移除 NVIDIA GPU,因为系统没有集成显卡。除此之外,我不确定还要测试什么,因为崩溃似乎毫无关联,也没有明确的规律。

您对导致此问题的原因有何见解?您建议采取哪些额外的故障排除步骤?

更新:很多人认为问题可能与内存有关。我运行了 MemTest86+,但没有检测到任何错误。为了确保万无一失,我又运行了几次。此外,我启动了一个比之前测试的两个版本更新的 Linux Live 环境(Kubuntu 24.04),也没有遇到任何崩溃。但是,由于崩溃完全是随机的,这可能只是巧合。为了确认,我正常使用系统,执行了各种任务,系统并没有崩溃。

我打算测试另一块显卡并更新BIOS。很遗憾,我无法测试其他CPU或电源。BIOS中,所有超频设置(包括时序调整)都恢复了默认设置。目前似乎没有任何正在进行的超频。

最终更新:问题出在内存上,就像很多人在这里说的那样。我运行了 memtest86+,结果显示错误超过 25000 条。经过一些测试后,我终于找到了导致问题的插槽,并更换了它。之后,我的 BIOS 又出现了一个无关的问题,所以我没能完成所有测试并告诉你我的答案是否正确,但最终它终于可以正常工作了。非常感谢。

bios
  • 4 4 个回答
  • 4763 Views

4 个回答

  • Voted
  1. Best Answer
    tsc_chazz
    2025-03-25T23:41:31+08:002025-03-25T23:41:31+08:00

    看似无关的地方发生的随机崩溃几乎总是内存问题。令人惊讶的是,内存确实会随着时间的推移而老化。在这种情况下,我首先会用新买的内存条替换掉;16GB DDR4 内存条是一个相对便宜的测试。

    但正如 DrMoishe Pippik 在评论中指出的那样,如果你的电脑是游戏玩家打造的,那么它很容易被超频,所以一个非常好的做法是检查 BIOS/UEFI 页面中的 CPU 速度和内存时序,看看它是否被超频了。nVidia 有一个控制面板小程序,通常只需在屏幕上右键点击即可打开,它会显示 GPU 或显存是否也被超频了。

    在这两个地方,如果您有“最佳速度”选项,那么就可以选择它。

    • 19
  2. Themoonisacheese
    2025-03-26T16:47:16+08:002025-03-26T16:47:16+08:00

    这并不是万能的,但你的问题与我之前遇到的一个问题很相似: 更换 CPU 后 Proxmox 无法启动

    那个问题里,我换了CPU,因为我也遇到过类似你的情况的系统崩溃,而且新CPU根本启动不了。最后是主板坏了。

    您应该确保已尝试所有故障排除步骤:

    1. 进行 24 小时内存测试。
    2. 确认你的显卡驱动程序是最新的
    3. 将你的 UEFI 固件升级到最新版本
    4. 上一步将清除你的超频设置(如果有),无论如何你都需要这样做
    5. 在另一台 PC 上测试 CPU(所有 AM4 主板均可接受 1600X,无需特殊考虑)。
    6. 尝试另一张视频卡,它可能是最差的,你只需要一些东西来输出视频。借用朋友的,或从某个地方获得一些 GT730 的版本。
    7. 或者,在另一台电脑上尝试使用您自己的视频卡来确认它没有问题。

    这些步骤应该能帮你找到崩溃和不崩溃的共同原因,从而准确地找到问题所在。就我的情况而言,最终发现是主板出了问题,但这并没有出现在我的“宾果卡”上,因为我一直认为主板只是“愚蠢”的部件。

    • 9
  3. MonkeyZeus
    2025-03-27T20:27:25+08:002025-03-27T20:27:25+08:00

    您正尝试完全依靠软件来诊断硬件问题。

    需要进行身体诊断。

    每次只执行一个要点。例如,不要同时更换内存和重新安装 GPU,因为如果问题消失,那么哪个步骤更值得称赞?执行完内存步骤后,将其恢复到原始配置,然后再执行 GPU 步骤。

    请注意,执行完单个要点后,您应该尝试使用计算机重现该问题。

    内存:

    • 尝试移除一根棍子
    • 尝试移除另一根棍子
    • 交换棍棒
    • 尝试在每个 RAM 插槽中使用一根内存条
    • 尝试在每个 RAM 插槽中使用另一根内存条
    • 用尽所有可能的 RAM 配置选项

    图形处理器:

    • 尝试重新安装 GPU
    • 借用 GPU 或购买便宜的 GPU 来换用几天
    • 重新涂抹优质导热膏和导热垫

    GPU 的所有组件上并不总是有温度传感器,因此如果它真的过热,那么您将一无所知。

    中央处理器:

    • 尝试重新安装 CPU
    • 检查 CPU 底部是否有划痕
    • 检查主板针脚
      • 你可能会发现,制造你电脑的人弄弯了一些主板针脚
      • 弯曲的引脚可能会因热膨胀/收缩而导致不稳定的碰撞
      • 弯曲的针脚也可能导致崩溃,因为当调用特定的 CPU 功能/指令集时,CPU 无法接触
    • 重新涂抹优质导热膏

    固态硬盘:

    • 如果有的话,将其安装在辅助插槽中
    • 购买新的SSD

    电源:

    • 正确测试 PSU 需要大多数人不具备的工具
    • 最便宜的办法是尝试新的 PSU
    • 旧电源在特定负载下可能会产生错误电压
    • 也许旧的无法应对某些电流峰值

    母板:

    • 正确测试主板并不适合胆小的人
    • 检查您的主板型号的评论,看看您的症状是否是一个常见问题
    • 目视检查所有插槽和端口是否有裂纹、碎片、弯曲的针脚、烧痕等......
    • 目视检查电容器和 VRM 是否有损坏迹象
    • 谷歌搜索“主板型号常见问题”是一个好的开始
    • 如果主板看起来不好,那么更换是常见的选择
    • 9
  4. T.E.D.
    2025-03-27T04:29:23+08:002025-03-27T04:29:23+08:00

    也许只是我一个人这样,但我以前发现,像您描述的这种看似随机的崩溃几乎总是由于我的显卡过热造成的。日志指向显卡硬件的事实让我更加怀疑。所以我很好奇您是怎么知道“电脑没有过热”的?

    我建议你打开机箱,运行电脑一段时间。定期目视检查所有风扇。有一次,我发现显卡上的一个风扇偶尔会卡住不转。更换风扇基本上解决了这个问题。

    一些迹象表明视频卡可能存在发热问题:

    • 如果您让 PC 静置(关机)几分钟,则崩溃后启动会更容易。
    • 当 GPU 处于持续负载(3D 游戏、渲染、比特币挖矿、SETI@Home 等)时,这种情况会更频繁或更可靠地发生。
    • 更改视频驱动程序似乎可以改变这种情况发生的频率。
    • 负载下偶尔会出现图形伪影。
    • 3D 游戏出现了以前没有出现过的性能问题。

    当然,一个简单的检查方法是换一块显卡,看看问题是否解决。不过这些显卡贵得吓人,所以如果你不是自己组装电脑,很可能没有备用的。

    • 3

相关问题

  • Windows 7,进入 BIOS 失败(我可以启动它,但没有任何反应)

  • 无法在 Aspire One D255 上通过 FreeDOS 更新 BIOS:致命错误 (1307) 内存不足

  • 如何从 Raspbian 中为非 UEFI 系统制作 Ubuntu LiveUSB?

  • 如何使用 Alienware Aurora R7 从 USB 闪存驱动器启动?

  • 我的 BIOS 坏了

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何减少“vmmem”进程的消耗?

    • 11 个回答
  • Marko Smith

    从 Microsoft Stream 下载视频

    • 4 个回答
  • Marko Smith

    Google Chrome DevTools 无法解析 SourceMap:chrome-extension

    • 6 个回答
  • Marko Smith

    Windows 照片查看器因为内存不足而无法运行?

    • 5 个回答
  • Marko Smith

    支持结束后如何激活 WindowsXP?

    • 6 个回答
  • Marko Smith

    远程桌面间歇性冻结

    • 7 个回答
  • Marko Smith

    子网掩码 /32 是什么意思?

    • 6 个回答
  • Marko Smith

    鼠标指针在 Windows 中按下的箭头键上移动?

    • 1 个回答
  • Marko Smith

    VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

    • 8 个回答
  • Marko Smith

    应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

    • 5 个回答
  • Martin Hope
    Vickel Firefox 不再允许粘贴到 WhatsApp 网页中? 2023-08-18 05:04:35 +0800 CST
  • Martin Hope
    Saaru Lindestøkke 为什么使用 Python 的 tar 库时 tar.xz 文件比 macOS tar 小 15 倍? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh 如何减少“vmmem”进程的消耗? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Windows 10 搜索未加载,显示空白窗口 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    andre_ss6 远程桌面间歇性冻结 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney 为什么在 URL 后面加一个点会删除登录信息? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension 鼠标指针在 Windows 中按下的箭头键上移动? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca 我所有的 Firefox 附加组件突然被禁用了,我该如何重新启用它们? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK 是否可以使用文本创建二维码? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 更改 git init 默认分支名称 2019-04-01 06:16:56 +0800 CST

热门标签

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve