AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 104354
In Process
LRE
LRE
Asked: 2010-01-20 13:52:22 +0800 CST2010-01-20 13:52:22 +0800 CST 2010-01-20 13:52:22 +0800 CST

LInux:我如何诊断/隔离导致“随机”挂起和自发重启的原因?

  • 772

因此,与其猜测原因是什么(尽管我的钱花在了 nvidia 驱动程序上),不如从哪里开始寻找一些事实?

我已经多次浏览过 /var/log ,但里面有很多东西,我(还)无法发现重要的部分。


背景:短版

我刚从 WinXP 转到 Ubuntu Karmic,就在它可用后。

从那以后,我经历了一系列看似随机的崩溃,表现为:

  • 自发重启
  • 完全锁定,我的 USB 键盘和鼠标变得无响应(直到 LED 全部关闭)。此外,发生这种情况时,我通常无法通过 ssh 连接到盒子。

我已经进行了大量搜索,Nvidia 似乎是主要嫌疑人,但我不知道从哪里开始寻找真正的原因是什么。

建议?



背景:长版

有时,我可以整整一周没有崩溃,然后在 2 天内有 5 次。

出于消除可能嫌疑人的愿望,我随着时间的推移进行了一些更改,但无济于事:

  • 最初我使用 KVM 进行虚拟化,我现在使用 VirtualBox OSE
  • 我在内核中运行 NFS,但现在使用 Samba
  • 我正在使用 Compiz,但后来关闭了它
  • 我已经从 64 位 Karmic 升级到 32 位(还有其他原因)
  • 我试过 Ubuntu、Kubuntu 和 Xubuntu。每次都一样的麻烦。
  • 我将 Nvidia 驱动程序从 185 版回滚到 96 版(NVIDIA Linux x86 Kernel Module 96.43.13 Thu Jun 25 18:42:21 PDT 2009)。这似乎降低了错误的频率。


就当时正在运行的内容而言,这可能会有所不同。以下是常见的,但不一定在每次崩溃时都运行:

  • 火狐 3.5
  • 带有 1 或 2 个 Windows XP 虚拟机的 VirtualBox OSE
  • Skype
  • Rhythmbox 或 Exaile


我的硬件使用了 2 - 3 年:

  • 酷睿 2 双核 6300
  • 4GB 内存
  • 那个年代的某种英特尔主板
  • 带有 Nvdia GeForce 7300 GS 芯片组的华硕双头显卡
  • 2 个 SATA 硬盘
  • 双显示器(因此我依赖专有的 nvidia 驱动程序)


我一直在关注我的系统更新。

希望上面的数据可能会提示某人建议值得研究的特定类型的日志或配置。

更新
RAM 似乎很好
以下建议将在超级用户上重新发布

linux ubuntu ubuntu-9.10
  • 3 3 个回答
  • 2886 Views

3 个回答

  • Voted
  1. Nunya
    2010-01-20T17:28:43+08:002010-01-20T17:28:43+08:00

    Linux 和其他类 Unix 系统比 Windows 对片状 RAM 更敏感。我会运行 memtest86 并检查 RAM

    • 2
  2. oliver
    2010-01-29T04:28:32+08:002010-01-29T04:28:32+08:00

    此类问题确实可能是硬件故障引起的(如果怀疑是nvidia驱动,可能是显卡硬件错误?)

    • 如果您启用了温度监控(使用传感器小程序/lm_sensors),是否有任何高读数?
    • 你有没有超频?
    • 你在 Windows 下也有奇怪的崩溃/挂起/重启吗?

    如果系统挂起,需要检查一些事项:

    • 键盘 LED 是否闪烁?表明内核恐慌(即内核崩溃)的 AFAIK
    • 您可以通过 Ping 访问系统吗?
    • 使用 SysRq 组合键(必须事先启用)查看是否可以从系统获得一些响应
      • 有关详细信息,请参阅http://en.wikipedia.org/wiki/Magic_SysRq_key
      • 您应该通过在虚拟终端上按 Alt+SysRq+h 来检查该键是否真正启用并工作(使用 Ctrl+Alt+F1 切换;使用 Ctrl+Alt+F7 切换回来)
    • 重新启动后,检查日志文件(/var/log/syslog、/var/log/Xorg.0.log)中的最后一条消息
    • 2
  3. Adam Ryczkowski
    2013-01-16T03:50:38+08:002013-01-16T03:50:38+08:00

    也许是硬件问题?我有损坏的视频卡的经验,它挂起计算机而没有在内核日志上留下任何痕迹。要隔离问题,请尝试一些使用合​​成的 LiveCD,或者更好:玩 3D 游戏;-)。参见:UL 论坛上的相关帖子

    • 0

相关问题

  • 更改 PHP 的默认配置设置?

  • 保护新的 Ubuntu 服务器 [关闭]

  • (软)Ubuntu 7.10 上的 RAID 6,我应该迁移到 8.10 吗?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve