Eu queria saber como o Linux poderia lidar com um Gamer Computer, então construí um, mas como sabemos que a GeForce não gosta tanto do Linux quanto da AMD, por isso escolhi o último.
Montei um computador com CPU AMD Ryzen 7 1800X e GPU Radeon RX 560D, pois o Vega é muito caro para eu comprar, e o benchmarking dizia que 560 é o melhor custo benefício atualmente.
Depois de algumas pesquisas, descobri que o sufixo D significa que ele tem um pouco menos de clock para economizar algum consumo de energia em comparação com o RX560 sem D.
Depois de inúmeras falhas durante jogos aleatórios, finalmente descobri que o problema é o superaquecimento da GPU, a velocidade do ventilador tende a seguir a velocidade do ventilador da CPU, mas é claro que a CPU é muito menos necessária do que a GPU em alguns jogos.
Resolvi parcialmente o problema personalizando a velocidade do ventilador com base na temperatura da GPU em vez da CPU, agora está crescendo gradativamente e atinge a velocidade máxima em 50 graus Celsius, mas o problema é: em alguns jogos ele mantém a velocidade máxima o tempo todo , e eventualmente ainda trava.
Descrevendo a falha: a tela pisca e depois fica preta, o ventilador da GPU para, o led do teclado pisca e depois desliga, mouse o mesmo, outro ventilador da CPU continua, às vezes o sistema fica congelado para sempre, às vezes o sistema reinicia automaticamente.
Como uma reinicialização é necessária, não consegui encontrar nenhuma dica nos logs do sistema, inicialmente pensei que fosse um pânico do kernel, mas mesmo usando o kdump e duplicando o kernel, o sistema ainda trava da maneira que não consegui recuperá-lo.
Não sei se o Windows teria o mesmo problema, mas acredito fortemente que não, nunca vi alguém com o mesmo problema no Windows, então minha dúvida é: existe alguma forma de dizer ao kernel para fazer a GPU pegar leve quando está prestes a superaquecer, talvez apenas reduzindo automaticamente a velocidade do clock da GPU?
Achei a solução, tem alguns arquivos no
/sys/class/drm/card0/device
arquivopp_dpm_mclk
indica GPU memory clock, e o arquivopp_dpm_sclk
indica GPU core clock, o meu:E o arquivo
power_dpm_force_performance_level
indica o perfil, que pode serlow
,auto
oumanual
, o padrão éauto
, quandolow
roda sempre no clock mais baixo, que não é exatamente o que eu quero, então configureimanual
e fiz um script que fica mudando o clock de acordo com a GPU temperatura, voilà, funcionou!Para alterar o relógio no
manual
perfil, basta escrever um número no arquivopp_dpm_sclk
que representa a linha, começando com0
, no meu caso até7
.Se você estiver interessado no meu script , aqui está .