如何解决/解决此问题?
使用 nvidia GPU,系统能够显示主板固件徽标和 Grub 屏幕。选择 Ubuntu 版本后,无论是 18.04 还是 20.01,都无法显示 Ubuntu 登录屏幕。相反,我看到黑屏出现了nvidia-modeset : ERROR: GPU:0 Idling display engine time out
3 次抱怨(见附图),然后是纯黑屏,GPU 不断加速到全速并变得非常热。我不得不按下电源按钮来关闭系统。
此 GPU 在此事件之前运行良好。当移除 GPU 并且将 Intel CPU 的集成显卡插入显示器时,Ubuntu 系统能够正常启动。IGPU 已禁用。
已安装的 nvidia 软件包:
$ dpkg -l | grep nvidia
ii libnvidia-cfg1-470:amd64 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA binary OpenGL/GLX configuration library
ii libnvidia-common-470 470.57.02-0ubuntu0.18.04.1 all Shared files used by the NVIDIA libraries
ii libnvidia-compute-470:amd64 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA libcompute package
ii libnvidia-compute-470:i386 470.57.02-0ubuntu0.18.04.1 i386 NVIDIA libcompute package
ii libnvidia-decode-470:amd64 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA Video Decoding runtime libraries
ii libnvidia-decode-470:i386 470.57.02-0ubuntu0.18.04.1 i386 NVIDIA Video Decoding runtime libraries
ii libnvidia-encode-470:amd64 470.57.02-0ubuntu0.18.04.1 amd64 NVENC Video Encoding runtime library
ii libnvidia-encode-470:i386 470.57.02-0ubuntu0.18.04.1 i386 NVENC Video Encoding runtime library
ii libnvidia-extra-470:amd64 470.57.02-0ubuntu0.18.04.1 amd64 Extra libraries for the NVIDIA driver
ii libnvidia-fbc1-470:amd64 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA OpenGL-based Framebuffer Capture runtime library
ii libnvidia-fbc1-470:i386 470.57.02-0ubuntu0.18.04.1 i386 NVIDIA OpenGL-based Framebuffer Capture runtime library
ii libnvidia-gl-470:amd64 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA OpenGL/GLX/EGL/GLES GLVND libraries and Vulkan ICD
ii libnvidia-gl-470:i386 470.57.02-0ubuntu0.18.04.1 i386 NVIDIA OpenGL/GLX/EGL/GLES GLVND libraries and Vulkan ICD
ii libnvidia-ifr1-470:amd64 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA OpenGL-based Inband Frame Readback runtime library
ii libnvidia-ifr1-470:i386 470.57.02-0ubuntu0.18.04.1 i386 NVIDIA OpenGL-based Inband Frame Readback runtime library
ii nvidia-compute-utils-470 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA compute utilities
ii nvidia-dkms-470 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA DKMS package
ii nvidia-driver-470 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA driver metapackage
ii nvidia-kernel-common-470 470.57.02-0ubuntu0.18.04.1 amd64 Shared files used with the kernel module
ii nvidia-kernel-source-470 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA kernel source package
ii nvidia-prime 0.8.16~0.18.04.1 all Tools to enable NVIDIA's Prime
ii nvidia-settings 470.57.01-0ubuntu0.18.04.1 amd64 Tool for configuring the NVIDIA graphics driver
ii nvidia-utils-470 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA driver support binaries
ii xserver-xorg-video-nvidia-470 470.57.02-0ubuntu0.18.04.1 amd64 NVIDIA binary Xorg driver
我在 Windows 系统上测试了这个 GPU,它能够显示启动屏幕、登录屏幕和桌面。但是,显示伪影仍然存在。另外,我怀疑 Windows 能够降低分辨率。
我看到这个youtube 视频显示了相同的显示伪影,并使用 NVidea MOD 和 MATS 发现问题源于其中一个 GPU VRAM。更换显存修复了显示问题。
由于此 GPU 维护良好,我想知道 GPU 显示故障是否是由于互连故障所致。我看到另一个youtube 视频,显示用热风枪重新加热 GPU 板 6 到 8 分钟有 10% 的修复 GPU 卡的成功率。他推荐这种治疗作为最后的手段。我用热风枪加热了显卡的 GPU 侧大约 4 分钟。此后,我将卡片翻过来再加热 2 分钟左右。GPU卡冷却后,我测试了它,发现它的功能恢复了。重新加热程序修复了 GPU 卡。早些时候,GPU卡被清洗过,但没有经过热处理;仅该程序并不能修复 GPU。