显然我是一个菜鸟 ubuntu 用户,所以请原谅我可能犯的任何严重错误或我可能没有的所需知识:D
预期的行为
我有一台Dell XPS13
运行最近安装的笔记本电脑Ubuntu 20.04 focal
,我想通过Nvidia GTX 1660 SUPER
eGPU改善视频体验,Razor Core X
理想情况下使用外部显示器上的输出。
实际行为
除了外部显示器上的黑屏外,我从未成功获得任何东西。
我试过的
我在 BIOS 中启用了 Thunderbolt 支持,并将其设置为不需要安全性,因此我一插入它就会被识别。我已经安装了列出的驱动程序ubuntu-driver devices
,主要是 nvidia-driver 的 440 版本:
ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:1c.4/0000:03:00.0/0000:04:01.0/0000:06:00.0/0000:07:01.0/0000:08:00.0 ==
modalias : pci:v000010DEd000021C4sv00001462sd0000C758bc03sc00i00
vendor : NVIDIA Corporation
model : TU116 [GeForce GTX 1660 SUPER]
manual_install: True
driver : nvidia-driver-440 - distro non-free recommended
driver : nvidia-driver-440-server - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
尽管我正确输入了密码,但我已经运行sudo ubuntu-driver autoinstall
并且登录屏幕不断出现。reboot
如果我拔下 eGPU,我可以通过登录屏幕。
如果我重新连接并运行,nvidia-smi
我会得到:
sudo nvidia-smi
[sudo] password for andrei:
Tue Sep 8 17:55:42 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.100 Driver Version: 440.100 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 166... Off | 00000000:3C:00.0 Off | N/A |
| 0% 40C P0 12W / 130W | 0MiB / 5944MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
其他注意事项:
- 我没有
/etc/X11/xorg.conf
/usr/lib/modprobe.d/nvidia-graphics-drivers.conf
看起来像这样:
blacklist nouveau
blacklist lbm-nouveau
alias nouveau off
alias lbm-nouveau off
我也跑步nvidia-settings
,我得到了这个:
ERROR: Unable to load info from any available system
(nvidia-settings:4382): GLib-GObject-CRITICAL **: 18:09:30.505: g_object_unref: assertion 'G_IS_OBJECT (object)' failed
** Message: 18:09:30.507: PRIME: Requires offloading
** Message: 18:09:30.507: PRIME: is it supported? yes
** Message: 18:09:30.534: PRIME: Usage: /usr/bin/prime-select nvidia|intel|on-demand|query
** Message: 18:09:30.534: PRIME: on-demand mode: "1"
** Message: 18:09:30.534: PRIME: is "on-demand" mode supported? yes
外接显示器上没有输出。
我还添加了尝试使用 ubuntu 图形驱动程序库sudo apt-add-repository ppa:graphics-drivers/ppa
并使用新推荐的驱动程序重复了上面介绍的过程,nvidia-driver-450
但结果相似,主要是无法登录或闪烁的登录屏幕,遗憾的是没有通过外部视频卡输出。
我也尝试过使用egpu-switcher
“nvidia-config which , I guess mainly tried to create/modify the
/etc/X11/xorg.conf”,但是我的外部显示器上从来没有输出(这是功能性的:),因为当同一根电缆直接连接到我的笔记本电脑时可以工作)。
如果有人可以提出一些建议,以对我和所有提到的硬件和软件来说,以一种幸福的方式结束这种痛苦,我们将不胜感激:)
谢谢!
更新
运行nvidia-settings
正在记录这个:
ERROR: Unable to load info from any available system
(nvidia-settings:20812): GLib-GObject-CRITICAL **: 01:58:56.002: g_object_unref: assertion 'G_IS_OBJECT (object)' failed
** Message: 01:58:56.005: PRIME: Requires offloading
** Message: 01:58:56.005: PRIME: is it supported? yes
** Message: 01:58:56.039: PRIME: Usage: /usr/bin/prime-select nvidia|intel|on-demand|query
** Message: 01:58:56.039: PRIME: on-demand mode: "1"
** Message: 01:58:56.039: PRIME: is "on-demand" mode supported? yes
经过长时间的战斗,我实际上能够主要根据以下评论解决我的问题:https ://forums.developer.nvidia.com/t/nvidia-xconfig-doesnt-do-what-i-want-it-to-nor -does-nvidia-settings/107883/7
所以,我认为在这种情况下理解
xorg.conf
不能帮助你是至关重要的。无论我做什么,我都无法获得任何结果,而我有一个xorg.conf
.对我有用的是:
/etc/X11/xorg.conf
您可能拥有的任何内容reboot
一般nvidia-prime
如果尚未安装,请安装sudo prime-select nvidia
/usr/share/X11/xorg.conf.d/10-amdgpu.conf
替换驱动程序modesetting
optimus.desktop
在其中创建两个文件/etc/xdg/autostart/
并/usr/share/gdm/greeter/autostart/
包含:(@generix 在那里说,
modesetting NVIDIA-0;
但对我来说它从来没有那样工作过。但是它适用于modesetting 0;
)reboot
通过运行测试一切是否良好:
__NV_PRIME_RENDER_OFFLOAD=1 __GLX_VENDOR_LIBRARY_NAME=nvidia glxinfo | grep vendor
如果它不返回带有 nvidia 的行,那就不好了在我的情况下,我得到:另一项检查是运行
nvidia-smi
会列出您至少一些进程。我从外部显示器上的 nvidia gpu 获得信号,正如我想要的:)
谢谢 ;)
还发现@bluehipy的解决方案非常有助于让我的 Acer Predator Helios 300 运行 Ubuntu 20.04 以与外部显示器配合使用,并正确安装 NVIDIA/CUDA 堆栈以进行深度学习工作,因为它会导致问题。
我只是在考虑实际返回 Acer Predator Helios 300 并查看带有 eGPU 的 Dell XPS 13 在本地调试机器学习/数据科学模型并实际在云上训练时是否可以用于“瘦客户端”类型的工作流时才发现这个线程。
如果其他人正在努力使他们的笔记本电脑工作,那么不妨对原始说明进行一些小调整?
先决条件:
sudo apt install gcc make mesa-utils mpich
安装 NVIDIA 驱动程序
对我有用的是:
删除您可能尝试过的所有 nvidia 内容:
sudo apt --purge remove nvidia-*
原始说明说下载最新的驱动程序,但您可能希望从最新的 CUDA 工具包中找到驱动程序版本,因此在安装时检查它是什么。可以使用最新的 NVIDIA 驱动程序吗?您需要检查最有可能与 CUDA 工具包驱动程序版本匹配的旧驱动程序,例如在这些说明时匹配的版本是 470.57.02 (NVIDIA-Linux-x86_64-470.57.02.run)。
以恢复模式重新启动(或没有运行 ax 服务器)并运行驱动程序安装程序,即使它说在您的系统上没有找到 gpu(降到根目录,例如
cd ../home/username/Downloads
and./NVIDIA-Linux-x86_64-470.74.run
)删除
/etc/X11/xorg.conf
您可能拥有的任何内容重启(点击
e
Ubuntu 的 grub 菜单并nomodeset
在末尾添加)如果尚未安装,请安装 nvidia-prime
sudo prime-select nvidia
更新
/usr/share/X11/xorg.conf.d/10-amdgpu.conf
替换驱动程序modesetting
sudo gedit /usr/share/X11/xorg.conf.d/10-nvidia.conf
):10 创建两个文件
optimus.desktop
,/etc/xdg/autostart/
其中/usr/share/gdm/greeter/autostart/
包含:修改 grub以便 nomodeset 每次都在那里:
sudo gedit /etc/default/grub
重启
通过运行测试一切是否正常:
__NV_PRIME_RENDER_OFFLOAD=1 __GLX_VENDOR_LIBRARY_NAME=nvidia glxinfo | grep vendor
检查是否
nvidia-smi
会列出您至少一些进程。安装 CUDA 工具包
说明时安装了最新的 CUDA 工具包
cuda_11.4.2_470.57.02_linux.run
,无需重新安装 NVIDIA 驱动程序CUDA工具包安装
验证 CUDA 安装
请参阅https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#install-samples
先决条件:(如果您想正确编译所有示例)来自:
例如
./deviceQuery
返回:cudnn 安装
请参阅https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html中的指南
下载 cuDNN v8.2.4(2021 年 9 月 2 日),用于 CUDA 11.4
-> Linux (x86_64) 的 cuDNN 库,例如
cudnn-11.4-linux-x64-v8.2.4.15.tgz
我有一个类似的设置,一个运行 Ubuntu Mate 20.4 的 NUC 和一个带有 NVidia RTX 2060 Super 的 Razor Core X。
基本上,我和你一样,没有任何效果。然后我搞砸了,不得不重新安装 Ubuntu。但是,我是在插入 eGPU 机箱的情况下执行此操作的。在安装过程中,会自动安装 NVidia 440 驱动程序。
此时我发现了以下帖子:
https://egpu.io/forums/thunderbolt-linux-setup/ubuntu-19-04-easy-to-use-setup-script-for-your-egpu/
使用存储库中提供的脚本,我终于可以让 GPU 工作了!我可以访问 CUDA,还可以使用两个带有 eGPU 的外接显示器。
我希望这个脚本也可以帮助你。祝你好运。