No Ubuntu Mate 22.04, atualizações recentes resultaram no erro “Sua memória GPU está cheia” do DaVinci Resolve, apesar de nenhum outro processo em execução.
Até agora, tentei limpar e reinstalar drivers da Nvidia, fazer downgrade para a versão anterior do DaVinci e drivers anteriores da Nvidia, atualizar manualmente 5 pacotes que foram retidos (gjs libgjs0g libnetplan0 libsgutils2-2 netplan.io) e, geralmente, tentar obter meu estação de trabalho novamente instalada e funcionando.
O computador está funcionando perfeitamente e retorna as informações normais ao entrar nvidia-smi
, então acho que a GPU funciona como deveria, há apenas alguns erros de comunicação acontecendo no DaVinci.
Existe uma maneira de fazer o downgrade dos drivers, CUDA ou qualquer outra coisa para a versão anterior até que isso seja (espero) resolvido?
A inicialização segura no UEFI está desabilitada, até onde sei, não há pacotes ou dependências quebrados ou ausentes. Mas recebo uma mensagem de erro genérica do Ubuntu na inicialização.
$ nvidia-smi
Thu Oct 12 10:50:14 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.113.01 Driver Version: 535.113.01 CUDA Version: 12.2 |
|-----------------------------------------+----------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+======================+======================|
| 0 NVIDIA GeForce RTX 3050 ... Off | 00000000:01:00.0 Off | N/A |
| N/A 40C P0 N/A / 35W | 9MiB / 4096MiB | 0% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+
+---------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=======================================================================================|
| 0 N/A N/A 1519 G /usr/lib/xorg/Xorg 4MiB |
+---------------------------------------------------------------------------------------+
Muito obrigado novamente ao @guiverc por toda a ajuda!
Acabou sendo uma incompatibilidade entre as pilhas de kernel (a atualização recente mudou para uma pilha de kernel HWE enquanto a versão anterior usava a pilha de kernel GA).
Trocando de volta para o kernel GA usando o link fornecido por @guiverc (
uname -r
para verificar o kernel correto inicializado no grub):https://wiki.ubuntu.com/Kernel/LTSEnablementStack
Limpar os drivers antigos e reinstalá-los enquanto estiver usando o kernel GA (o mais novo sendo
nvidia-driver-535
enquanto escrevo isto), junto com os cabeçalhos apropriados para o kernel 5.15/GA usando a resposta neste link (e reinicializando):https://forums.developer.nvidia.com/t/nvidia-smi-has-failed-porque-it-couldnt-communicate-with-the-nvidia-driver-make-sure-that-the-latest-nvidia- driver-está-instalado e em execução/197141
E DaVinci funcionou de novo! Replay de vídeo e tudo!
PS: Sendo um usuário novato do Ubuntu, fiquei bastante nervoso por quebrar algo involuntariamente novamente. Então, em vez de limpar os sabores do kernel que não estavam funcionando, configurei
grub-customizer
para inicializar a partir da entrada inicializada anteriormente:Defina o kernel "mais antigo" como entrada padrão do grub
Não é a solução mais limpa, mas estou feliz por ter minha estação de trabalho de volta à edição de vídeos.
Também estou pensando em configurar um backup do sistema como o TimeShift, para evitar esse problema no futuro, já que a Nvidia/DaVinci tem causado problemas no Ubuntu pelo menos trimestralmente.