AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / ubuntu / 问题 / 1252964
Accepted
Lars Ericson
Lars Ericson
Asked: 2020-06-23 18:36:16 +0800 CST2020-06-23 18:36:16 +0800 CST 2020-06-23 18:36:16 +0800 CST

请帮助在 WSL 2 上配置 NVIDIA-SMI Ubuntu 20.04

  • 772

在此公告之后并有点试图遵循这个令人困惑的线程,我

  • 已安装 Windows 版本 10.0.20150 Build 20150
  • 已安装 NVidia 驱动程序版本 455.51
  • 从 Windows 应用商店安装 Ubuntu 20.04 LTS

我启动了 Ubuntu 并尝试运行 NVIDIA-SMI。它告诉我它不存在,但我可以使用以下选项之一安装它:

Command 'nvidia-smi' not found, but can be installed with:

sudo apt install nvidia-340        # version 340.108-0ubuntu2, or
sudo apt install nvidia-utils-390  # version 390.132-0ubuntu2
sudo apt install nvidia-utils-435  # version 435.21-0ubuntu7
sudo apt install nvidia-utils-440  # version 440.82+really.440.64-0ubuntu6

请注意,没有nvidia-utils-450与我的 455.51 对应的选项,上面的 NVidia 线程在某处说,这需要让事情顺利进行。然后我跑了

sudo apt install nvidia-utils-440
nvidia-smi

它说“没有找到设备”。

然后我找到了这个指南。我卸载了 Ubunto 20.04,然后按照指南进行操作。导游要求我

  • 安装一个香草 Ubuntu(没有发行号),而不是 20.04。(结果是给了我 20.04)。
  • 安装 Windows 终端(我选择了预览版)
  • 检查以接收相关 Windows 程序的更新
  • 将内核更新到 4.9.121
  • 在 Windows 10 上安装 NVIDIA CUDA 驱动程序(我已经做了 455,必须检查 CUDA 版本)
  • 安装 Docker
  • 安装 NVidia 容器工具包
  • 测试

该指南的“安装 docker”部分似乎有问题。我无法启动 docker 服务。所以我卸载了我的 Ubuntu 并重复了这些步骤,没有接触 Docker。然后(我的版本),从 Docker 点开始的步骤是(对于 docker 部分,我按照这些说明获取 Docker):

sudo apt-get update
sudo apt-get upgrade
sudo apt update
sudo apt install apt-transport-https ca-certificates curl software-properties-common
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu focal stable"
sudo apt update
apt-cache policy docker-ce
sudo apt install docker-ce
sudo systemctl status docker

最后一步失败。我收到这条消息:

$ sudo systemctl status docker
System has not been booted with systemd as init system (PID 1). Can't operate.
Failed to connect to bus: Host is down

这导致我来到这里,第四个也是几乎得分最低的答案似乎有效,除了它需要在后台模式下运行:

sudo dockerd &
sudo usermod -aG docker your-user

然后我回到Docker 安装后的指南并继续

docker run --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark

这失败了

ERRO[2020-06-23T07:28:28.582848400-04:00] 5cd9b9d7011ba20f72971dd27900b23b2c0f6be656b0bd53b9e178944fe4eba6 cleanup: failed to delete container from containerd: no such container
ERRO[2020-06-23T07:28:28.582946600-04:00] Handler for POST /v1.40/containers/5cd9b9d7011ba20f72971dd27900b23b2c0f6be656b0bd53b9e178944fe4eba6/start returned error: could not select device driver "" with capabilities: [[gpu]]
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].
ERRO[0018] error waiting for container: context canceled

最后我回到了NVidia 的公告并做了这些步骤:

sudo apt-get update
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
curl -s -L https://nvidia.github.io/libnvidia-container/experimental/$distribution/libnvidia-container-experimental.list | sudo tee /etc/apt/sources.list.d/libnvidia-container-experimental.list
sudo apt-get update
sudo apt-get install -y nvidia-docker2
sudo dockerd &
docker run --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark

成功:我得到了一个快乐的结果:

> Windowed mode
> Simulation data stored in video memory
> Single precision floating point simulation
> 1 Devices used for simulation
GPU Device 0: "Quadro M500M" with compute capability 5.0

> Compute 5.0 CUDA device: [Quadro M500M]
3072 bodies, total time for 10 iterations: 3.817 ms
= 24.724 billion interactions per second
= 494.487 single-precision GFLOP/s at 20 flops per interaction

但是,根据下面的答案,根据已知的 NVIDIA 限制,没有 NVIDIA-SMI 。

进一步说明:上面的 docker 容器测试适用于 Ubuntu shell。它不适用于带有 Ubuntu 选项卡的 Windows Powershell Preview。

nvidia microsoft windows-10 windows-subsystem-for-linux 20.04
  • 3 3 个回答
  • 14252 Views

3 个回答

  • Voted
  1. Best Answer
    onoma
    2020-06-24T04:12:13+08:002020-06-24T04:12:13+08:00

    如果 nbody 工作,那么你已经配置好一切。问题是 NVIDIA 驱动程序的限制。 https://docs.nvidia.com/cuda/wsl-user-guide/index.html#known-limitations

    NVIDIA Management Library (NVML) APIs are not supported.

    nvidia-smi 基于 NVIDIA 管理库 (NVML)。

    • 5
  2. Haoyu Wang
    2020-12-23T22:50:37+08:002020-12-23T22:50:37+08:00

    @onoma 答案的更新。来自https://docs.nvidia.com/cuda/wsl-user-guide/index.html#known-limitations:

    6. nvidia-smi is not yet packaged for CUDA on WSL 2.
    

    希望nvidia将来能解决这个问题。

    • 2
  3. hackore
    2022-04-26T16:49:39+08:002022-04-26T16:49:39+08:00

    nvidia-smiWSL2 现在支持截至2022 年 4 月 25 日的更新

    按照 nvidia 官方文档成功安装 CUDA 后:

    wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pin
    sudo mv cuda-wsl-ubuntu.pin /etc/apt/preferences.d/cuda-repository-pin-600
    wget https://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda-repo-wsl-ubuntu-11-4-local_11.4.0-1_amd64.deb
    sudo dpkg -i cuda-repo-wsl-ubuntu-11-4-local_11.4.0-1_amd64.deb
    sudo apt-key add /var/cuda-repo-wsl-ubuntu-11-4-local/7fa2af80.pub
    sudo apt-get update
    sudo apt-get -y install cuda
    

    您应该有nvidia-smi可用的,usr/lib/wsl/lib/nvidia-smi因此您可以添加usr/lib/wsl/lib到PATH轻松运行nvidia-smi。

    • 1

相关问题

  • 普利茅斯将来会允许使用专有图形驱动程序获得良好的启动体验吗?

  • 未连接到任何可见进程的令人讨厌的 CPU 峰值

  • 10.04 Lucid 中的多席位状态如何?[关闭]

  • 升级到 10.04 后字体模糊,Nvidia 问题?

  • 帮助让 Flash 播放器在第二个屏幕上工作?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何运行 .sh 脚本?

    • 16 个回答
  • Marko Smith

    如何安装 .tar.gz(或 .tar.bz2)文件?

    • 14 个回答
  • Marko Smith

    如何列出所有已安装的软件包

    • 24 个回答
  • Marko Smith

    无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗?

    • 25 个回答
  • Martin Hope
    Flimm 如何在没有 sudo 的情况下使用 docker? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    Ivan 如何列出所有已安装的软件包 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    La Ode Adam Saputra 无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗? 2010-11-30 18:12:48 +0800 CST
  • Martin Hope
    David Barry 如何从命令行确定目录(文件夹)的总大小? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher “以下软件包已被保留:”为什么以及如何解决? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford 如何删除 PPA? 2010-07-30 01:09:42 +0800 CST

热门标签

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve