Instalei o CUDA Toolkit 12.6 Update 1 no Ubuntu 22.04 usando o comando abaixo (as instruções podem ser encontradas aqui ):
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.6.1/local_installers/cuda-repo-ubuntu2204-12-6-local_12.6.1-560.35.03-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-12-6-local_12.6.1-560.35.03-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-6-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-6
A instalação foi bem-sucedida. No entanto, a nvcc
versão ainda é 11.5. Aqui estão 2 pacotes que instalei. Pensei que instalar o CUDA Toolkit 12.6 substituiria o 11.5, mas o NVCC ainda vem do 11.5.
$ dpkg -l nvidia-cuda-toolkit
Desired=Unknown/Install/Remove/Purge/Hold
| Status=Not/Inst/Conf-files/Unpacked/halF-conf/Half-inst/trig-aWait/Trig-pend
|/ Err?=(none)/Reinst-required (Status,Err: uppercase=bad)
||/ Name Version Architecture Description
+++-===================-===============-============-=================================
ii nvidia-cuda-toolkit 11.5.1-1ubuntu1 amd64 NVIDIA CUDA development toolkit
$ dpkg -l cuda-toolkit-12-6
Desired=Unknown/Install/Remove/Purge/Hold
| Status=Not/Inst/Conf-files/Unpacked/halF-conf/Half-inst/trig-aWait/Trig-pend
|/ Err?=(none)/Reinst-required (Status,Err: uppercase=bad)
||/ Name Version Architecture Description
+++-=================-============-============-=================================
ii cuda-toolkit-12-6 12.6.1-1 amd64 CUDA Toolkit 12.6 meta-package
Como posso atualizar a nvcc
versão para 12.6?
Aqui está a saída de nvcc -V
:
$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Thu_Nov_18_09:45:30_PST_2021
Cuda compilation tools, release 11.5, V11.5.119
Build cuda_11.5.r11.5/compiler.30672275_0
Listando o conteúdo do cuda-toolkit-12-6
, ele não inclui nvcc
:
$ dpkg -L cuda-toolkit-12-6
/.
/usr
/usr/local
/usr/local/cuda-12.6
/usr/local/cuda-12.6/version.json
/usr/share
/usr/share/doc
/usr/share/doc/cuda-toolkit-12-6
/usr/share/doc/cuda-toolkit-12-6/changelog.Debian.gz
Saída de nvidia-smi
:
$ nvidia-smi
Mon Sep 23 13:11:55 2024
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.183.01 Driver Version: 535.183.01 CUDA Version: 12.2 |
|-----------------------------------------+----------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+======================+======================|
| 0 NVIDIA GeForce RTX 4090 Off | 00000000:81:00.0 Off | Off |
| 0% 24C P8 21W / 450W | 10893MiB / 24564MiB | 0% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+
| 1 NVIDIA GeForce RTX 4090 Off | 00000000:C1:00.0 Off | Off |
| 0% 24C P8 32W / 450W | 818MiB / 24564MiB | 0% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+
+---------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=======================================================================================|
| 0 N/A N/A 1720 G /usr/lib/xorg/Xorg 4MiB |
| 0 N/A N/A 2174 C /usr/local/bin/ollama 384MiB |
| 0 N/A N/A 1808406 C /opt/tljh/user/bin/python 10486MiB |
| 1 N/A N/A 1720 G /usr/lib/xorg/Xorg 15MiB |
| 1 N/A N/A 1896 G /usr/bin/gnome-shell 10MiB |
| 1 N/A N/A 2174 C /usr/local/bin/ollama 384MiB |
| 1 N/A N/A 1808406 C /opt/tljh/user/bin/python 386MiB |
+---------------------------------------------------------------------------------------+
Você deve verificar suas variáveis de ambiente. É possível que
nvcc
ainda esteja apontando para CUDA 11.5 porque seuPATH
eLD_LIBRARY_PATH
estão definidos para a versão antiga.Para corrigir isso, atualize suas variáveis de ambiente adicionando as seguintes linhas ao seu
.bashrc
(ou.zshrc
):Em seguida, obtenha o arquivo:
Isso deve
nvcc
apontar para a versão correta do CUDA.ou crie um link simbólico apontando para sua nova versão do CUDA.