我最近说过使用具有华硕 bios 的 NVIDIA DevBox,以及上面提到的内核版本和 ubuntu 版本。由于某些原因,机器不能像其他笔记本电脑和/或计算机机器一样整夜开机:您可以将其留在机器上,几分钟后它会自行锁定和/或进入睡眠模式- 第二天,一旦您移动鼠标或在键盘上键入内容,计算机就会“取消暂停”或唤醒,您的所有程序都已打开并运行,就像您前一天离开它们的方式一样。
出于某种奇怪的原因,这台机器没有发生这种情况。我之前有一位用户大约一年没有接触过机器,所以他/她可能已经做了一些关于省电的配置,但是当我检查电源选项时一切看起来都很好在我的机器中(我有它暂停 - 1 小时,并锁定 1 小时)。我想我注意到的有趣的事情是,如果我午饭后回来并且机器被锁定/暂停,它会毫无问题地回到会话中,但如果我把它放在一夜之间,那么我第二天就会到达机器已自动关闭。大楼被锁住了,所以其他人不可能在一夜之间按电源关闭按钮,而我'
我在几个地方读到它可能是由于电源不良或损坏而导致的加热问题,但我如何检查是否是这种情况?我有 psensor 应用程序,但这似乎只是实时记录温度,而没有将它们保存到一个文件中,我可以在其中检查任何显卡(有 4 个)或主板的温度。
诊断机器自动关机的另一种方法是什么?我怎么知道是加热问题还是电源故障?或者可能是内核问题?除了我在安装方面非常有经验的 NVIDIA 驱动程序外,这台机器目前没有安装真正的密集程序(几乎是新的),所以也许我可以考虑安装全新的 Ubuntu?- 尽管如果存在硬件问题,这几乎毫无意义
其他详情:
NVIDIA 驱动程序已正确安装。当我强制执行以下命令并且机器连续运行 2 天(这对这些机器来说应该是轻而易举的)时,驱动程序被窃听并且机器响应非常糟糕,直到它在超过 5 分钟后很难运行半夜连续随机重启 2 次:
$ unset autologoff
我必须稍后正确地重新安装驱动程序(并重新设置自动日志选项),并且系统回到其当前状态,如果超过 24 小时不做任何事情(不做任何事情),它“需要”自行关闭因为它没有接收人工输入,但后端进程可能仍在运行)。
- 主板:华硕 EATX DDR4 LGA 2011-3 主板 X99-E WS/USB 3.1
- CPU:英特尔至强 E5-2690 v4 2.6 GHz 14 核 LGA 2011 处理器 135 W
- 冷却器:Corsair Hydro Series H80i v2 Extreme Performance Liquid CPU Cooler,黑色。
- 电源:EVGA SuperNOVA 1600 P2 80+ PLATINUM,1600W ECO 模式全模块化 NVIDIA SLI 和 Crossfire Ready 10 年保修电源 220-P2-1600-X1
- 显卡:4 Titan X Pascal。
pci=noaer
在发现机器给我这个错误后,我添加了in booting: https ://askubuntu.com/questions/771899/pcie-bus-error-severity-corrected
输出:
$ cat /proc/cmdline
是
BOOT_IMAGE=/boot/vmlinuz-4.4.0-137-generic.efi.signed root=UUID=569dd2ad-c5a6-4ae4-a167-f849b8f6ae9e ro quiet splash pci=noaer vt.handoff=7