Hoje eu estava trabalhando em uma máquina remota (do tipo que provavelmente nunca verei), e ela estava travada, então eu disse ao usuário para reiniciá-la. A máquina voltou a funcionar e eu entrei ssh
nela, mas assim que o fiz, recebi uma mensagem sobre a temperatura estar acima de 60°C, e então o kernel desligou a máquina novamente e, é claro, fui desconectado de ssh
.
Estamos prestes a inicializar a máquina novamente, existe alguma maneira de ler as coisas de um log que informa que no passado esta máquina foi desligada porque estava muito quente?
Quando a máquina superaquece, antes que o kernel desligue o sistema, ela produz uma mensagem armazenada no arquivo de log. Para
systemd
configuração, este arquivo é acessível viajournalctl
comando e a saída relevante deve ser assim:Então, precisamos procurar por coisas de 'temperatura crítica' no
$SYSTEMD_PAGER
(geralmenteless
) ou diretamente:Você pode adicionar
-b -1
para pesquisar apenas nas mensagens do boot antes do último.Com isso dito, acho que 60 ° C é realmente muito baixo para o ponto de disparo. A maioria das CPUs geralmente atinge essa temperatura durante a compilação ou outras tarefas engenhosas. Certifique-se de ter todos os módulos apropriados carregados (para seu processador) e verifique os parâmetros térmicos com
sensors-detect
seguido desensors
comando.