因此,与其猜测原因是什么(尽管我的钱花在了 nvidia 驱动程序上),不如从哪里开始寻找一些事实?
我已经多次浏览过 /var/log ,但里面有很多东西,我(还)无法发现重要的部分。
背景:短版
我刚从 WinXP 转到 Ubuntu Karmic,就在它可用后。
从那以后,我经历了一系列看似随机的崩溃,表现为:
- 自发重启
- 完全锁定,我的 USB 键盘和鼠标变得无响应(直到 LED 全部关闭)。此外,发生这种情况时,我通常无法通过 ssh 连接到盒子。
我已经进行了大量搜索,Nvidia 似乎是主要嫌疑人,但我不知道从哪里开始寻找真正的原因是什么。
建议?
背景:长版
有时,我可以整整一周没有崩溃,然后在 2 天内有 5 次。
出于消除可能嫌疑人的愿望,我随着时间的推移进行了一些更改,但无济于事:
- 最初我使用 KVM 进行虚拟化,我现在使用 VirtualBox OSE
- 我在内核中运行 NFS,但现在使用 Samba
- 我正在使用 Compiz,但后来关闭了它
- 我已经从 64 位 Karmic 升级到 32 位(还有其他原因)
- 我试过 Ubuntu、Kubuntu 和 Xubuntu。每次都一样的麻烦。
- 我将 Nvidia 驱动程序从 185 版回滚到 96 版(NVIDIA Linux x86 Kernel Module 96.43.13 Thu Jun 25 18:42:21 PDT 2009)。这似乎降低了错误的频率。
就当时正在运行的内容而言,这可能会有所不同。以下是常见的,但不一定在每次崩溃时都运行:
- 火狐 3.5
- 带有 1 或 2 个 Windows XP 虚拟机的 VirtualBox OSE
- Skype
- Rhythmbox 或 Exaile
我的硬件使用了 2 - 3 年:
- 酷睿 2 双核 6300
- 4GB 内存
- 那个年代的某种英特尔主板
- 带有 Nvdia GeForce 7300 GS 芯片组的华硕双头显卡
- 2 个 SATA 硬盘
- 双显示器(因此我依赖专有的 nvidia 驱动程序)
我一直在关注我的系统更新。
希望上面的数据可能会提示某人建议值得研究的特定类型的日志或配置。
更新
RAM 似乎很好
以下建议将在超级用户上重新发布
Linux 和其他类 Unix 系统比 Windows 对片状 RAM 更敏感。我会运行 memtest86 并检查 RAM
此类问题确实可能是硬件故障引起的(如果怀疑是nvidia驱动,可能是显卡硬件错误?)
如果系统挂起,需要检查一些事项:
也许是硬件问题?我有损坏的视频卡的经验,它挂起计算机而没有在内核日志上留下任何痕迹。要隔离问题,请尝试一些使用合成的 LiveCD,或者更好:玩 3D 游戏;-)。参见:UL 论坛上的相关帖子