No meu computador doméstico principal, estou executando o fedora 39. Originalmente, ele não estava executando o fedora 39, atualizei pelo menos 2 versões anteriores. Meu problema é que a cada poucas horas meu sistema congela completamente ou ainda consigo mover o mouse pela tela, mas não consigo fazer mais nada. Não consigo Ctrl-Alt-F* cair para um console ou algo parecido, a única solução é reiniciar.
Tenho lidado com esse problema há anos, tenho a sensação de que está relacionado à minha placa gráfica (AMD Radeon 5700 agora, mas tive um AMD RX 480 no passado no mesmo computador com problemas semelhantes), mas eu tenho não me lembro de onde vem esse sentimento.
A cada nova inicialização, dou uma olhada no final, journalctl -k -b -1
mas não vejo nada se repetindo ali nas ocorrências, nem nada que chame minha atenção. Atualizei recentemente meu BIOS, mas isso não parece ter melhorado nada
Eu queria dizer que tenho dumps de kernel habilitados, mas nada foi gravado em /var/crash, mas agora vejo que tenho um dump de novembro, olhando no log do dmesg lá eu vejo
[ 7082.889352] BUG: kernel NULL pointer dereference, address: 0000000000000000
[ 7082.889361] #PF: supervisor read access in kernel mode
[ 7082.889366] #PF: error_code(0x0000) - not-present page
[ 7082.889370] PGD 0 P4D 0
[ 7082.889377] Oops: 0000 [#1] PREEMPT SMP NOPTI
[ 7082.889384] CPU: 11 PID: 0 Comm: swapper/11 Kdump: loaded Tainted: G OE 6.5.9-200.fc38.x86_64 #1
[ 7082.889391] Hardware name: Micro-Star International Co., Ltd MS-7B00/B350 GAMING PRO CARBON (MS-7B00), BIOS 1.50 08/02/2017
[ 7082.889395] RIP: 0010:dc_stream_get_scanoutpos+0x5b/0x80 [amdgpu]
Talvez eu já tenha visto algo assim no passado e é por isso que suspeito do amdgpu. Mas, novamente, recebo congelamentos diariamente, embora aparentemente só tive um bug no kernel uma vez, meses atrás.
Obrigado por ler até agora, minha pergunta é: Alguém tem alguma ideia de como posso usar software para rastrear o problema? A única ideia que tenho é começar a trocar o hardware e ver se isso resolve alguma coisa, mas isso vai custar e se eu seguir esse caminho, posso muito bem atualizar meu computador, o que gostaria de não fazer por mais alguns anos.
Muito obrigado
Há algum tempo, na minha máquina Fedora, tive exatamente o mesmo problema que você descreveu. Eu estaria usando meu computador e ele congelaria aleatoriamente, mas normalmente o mouse continuaria a se mover. Inicialmente pensei que havia um problema com minha placa gráfica Asus GeForce 8800 GT. No entanto, removi a placa gráfica e ainda tive esses congelamentos aleatórios. Nada nos logs porque tive que reiniciar. Eu tinha uma cópia do memtest86então resolvi fazer um teste na memória e assim que comecei a rodar o Memtest86 recebi muitos erros. Então eu estava pensando que um dos meus bancos de memória estava mal encaixado ou havia desenvolvido um erro. Verifiquei o assentamento dos cartões de memória e estava tudo bem. No entanto, notei que havia muita poeira em uma área específica do cartão de memória mais próxima da ventoinha do processador. Eu removi todos os cartões de memória e limpei cuidadosamente os módulos de memória, bem como os cartões de memória e recoloquei os cartões de memória de volta nos módulos. Desde então, não tive nenhum congelamento aleatório.
Talvez o seu problema seja o mesmo e executar o Memtest86 seja muito simples. Baixe a versão correta se você inicializar a partir do BIOS em vez do uefi. Deixe-nos saber como vai.