AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / computer / 问题 / 1853188
Accepted
AdderoYuu
AdderoYuu
Asked: 2024-08-23 12:17:02 +0800 CST2024-08-23 12:17:02 +0800 CST 2024-08-23 12:17:02 +0800 CST

Dell R730 服务器给出模糊的 CPU0704 机器检查错误

  • 772

我有一台 Dell R730 服务器,一直用作 Proxmox 主机,突然收到一条错误,日志中显示“CPU0704:检测到 CPU 2 机器检查错误”。这是触发 iDRAC 重新启动机器的触发器,重新启动后,屏幕上会显示一条警告,提示存在机器检查错误(我无法再让它显示在屏幕上)。

以前没有出现过这种情况,而且似乎是随机发生的。我尝试重置系统时间,因为一开始似乎只在午夜发生这种情况,但后来它在中午失败了,而且似乎与时间无关。在 0704 错误之前,日志显示有四到五个“发生了 OEM 诊断事件”。

我在网上进行的所有研究似乎都表明,对于这个错误是什么,人们的建议不一,更不用说该怎么做了

hardware-failure
  • 1 1 个回答
  • 19 Views

1 个回答

  • Voted
  1. Best Answer
    AdderoYuu
    2024-08-23T12:17:02+08:002024-08-23T12:17:02+08:00

    虽然我还没有弄清楚所有的细节,但我已经发现了这个错误试图表达的意思,以及如果收到这个错误要遵循的一些故障排除步骤。

    1. 这是什么?戴尔将此错误描述为“通常不是 CPU 本身的错误。但表明 CPU 已检测到系统中的错误,或从系统组件接收到了错误指令。它是由非 CPU 事件引起的,例如固件不匹配、系统总线中断或内存读/写中断。理论上,任何系统组件、软件或硬件都可能引起此错误。”(戴尔 PowerEdge:解决服务器上 CPU 1 或 2 出现内部错误 (CPU IERR) 的问题)

    即,CPU2 控制的子系统内出现通信错误并标记了此错误。

    1. 我该如何诊断?此错误可能表示多种不同的情况,也可能由不同的组件引起。它表示错误出在 CPU2 上,由于这是一台 2 CPU 服务器,因此我们可以排除错误与由 CPU1 驱动或连接到 CPU1 的任何组件有关。因此,现在我们应该查看内存控制器、内存 (RAM) PCIe 插槽以及连接到 CPU 2 的任何其他东西,以及 CPU 2 本身。

    我开始按照上面链接的知识库文章中的建议,通过更新 BIOS 和 iDRAC 进行故障排除。我还拔下了系统电源插头,按住按钮 20 秒,然后重新打开电源 - 但不幸的是,这不是原因。

    如果系统在保修期内,您可以将其送回戴尔并让他们处理。我的是一台回收的服务器,当然这不是一个选择。但是,请注意,我只是一个新手用户,正在学习如何“边做边学”管理这些设备,如果您不知道自己在做什么,我不建议您进一步遵循此故障排除。此时您可能正在处理硬件故障,并且不能保证这些后续步骤会有所帮助。

    从这里开始,一个旧论坛上的某个人建议在 BIOS 中禁用 C1E 状态(我再也找不到这个帖子了,抱歉),但在我这样做之后,这并没有起到任何作用。我运行了硬件诊断程序(完整的,1 小时加 1 小时),但没有发现任何异常。现在我决定我没有什么可失去的了,于是从我的机架上拔出了庞大的 R730,并拉出了 CPU 2 的 CPU 散热器。我拔出了为 CPU2 安装的所有内存,并把它放在外面,怀疑 IT 才是我真正要处理的问题。但为了保险起见,我还拔出了 CPU,清洁了散热器和散热器,更换了导热膏,然后重新安装。

    这实际上解决了问题。我这样做之后让系统运行了 3 天以上,之后我没有再看到错误出现。很难说是 CPU 重新安装解决了问题,还是我的 RAM 坏了,或者更糟糕的是 RAM 插槽坏了或内存控制器坏了……但很可能是 RAM 需要重新安装。我已经重新安装了 RAM,我将让系统再次运行几天,看看这个问题是否得到解决。如果没有,我可能会将 RAM 切换到不同的插槽,如果这不起作用,我可能有一些坏的 RAM。CPU 2 上安装了 64 GB,所以我会尽最大努力让它工作,但我们只能拭目以待。

    长话短说 - 如果您已经尝试了所有方法但仍然无法解决此问题,请尝试重新安装 CPU 并从受影响的 CPU 中移除内存。如果您仍然遇到此问题,可能是时候考虑更换 CPU 或进行一些更高级的故障排除了。但如果您看到的症状与我的情况类似,它几乎没有给您提供任何额外的信息,您可能只需要重新安装即可恢复正常运行!

    • 0

相关问题

  • 如何找出我的 PC 无法启动的原因?

  • 将 GPU 长时间保持在 100% 利用率是否安全?

  • 数字支票设备重置过程

  • Windows 10 安装随机关闭,但 Ubuntu 运行良好,直到我使用 stress -c 8

  • 使用 HP Recovery Manager 执行出厂映像恢复与完全干净格式一样吗?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何减少“vmmem”进程的消耗?

    • 11 个回答
  • Marko Smith

    从 Microsoft Stream 下载视频

    • 4 个回答
  • Marko Smith

    Google Chrome DevTools 无法解析 SourceMap:chrome-extension

    • 6 个回答
  • Marko Smith

    Windows 照片查看器因为内存不足而无法运行?

    • 5 个回答
  • Marko Smith

    支持结束后如何激活 WindowsXP?

    • 6 个回答
  • Marko Smith

    远程桌面间歇性冻结

    • 7 个回答
  • Marko Smith

    子网掩码 /32 是什么意思?

    • 6 个回答
  • Marko Smith

    鼠标指针在 Windows 中按下的箭头键上移动?

    • 1 个回答
  • Marko Smith

    VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

    • 8 个回答
  • Marko Smith

    应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

    • 5 个回答
  • Martin Hope
    Vickel Firefox 不再允许粘贴到 WhatsApp 网页中? 2023-08-18 05:04:35 +0800 CST
  • Martin Hope
    Saaru Lindestøkke 为什么使用 Python 的 tar 库时 tar.xz 文件比 macOS tar 小 15 倍? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh 如何减少“vmmem”进程的消耗? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Windows 10 搜索未加载,显示空白窗口 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    andre_ss6 远程桌面间歇性冻结 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney 为什么在 URL 后面加一个点会删除登录信息? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension 鼠标指针在 Windows 中按下的箭头键上移动? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca 我所有的 Firefox 附加组件突然被禁用了,我该如何重新启用它们? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK 是否可以使用文本创建二维码? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 更改 git init 默认分支名称 2019-04-01 06:16:56 +0800 CST

热门标签

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve