Meu PC reiniciou recentemente por conta própria e, após isso, o abrt me notificou de que havia um provável erro relacionado ao hardware. Verificando o dmesg, encontrei as seguintes linhas do mce:
[ 0.554142] mce: [Hardware Error]: Machine check events logged
[ 0.554143] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 3: baa0000000040118
[ 0.554145] mce: [Hardware Error]: TSC 0 MISC d012000100000000 SYND 4d000000 IPID 300b000000000
[ 0.554148] mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1590567072 SOCKET 0 APIC 0 microcode 8701013
Como eu interpretaria isso? Observo que ele informa a versão do microcódigo, em qual soquete minha CPU está (0, já que só tenho uma), e assim por diante, mas isso significa que a CPU está com defeito? Agradeceria alguma luz sobre a situação.
O programa mcelog pode fornecer algumas explicações:
Eu extraí a parte do texto do erro:
Em seguida, executei em uma VM Linux Mint, o que me deu uma análise muito parcial, onde a parte importante foi:
Você obteria mais detalhes executando a análise no computador onde ocorreu o erro.
Minha opinião, com base em suas informações, é que este é um problema de RAM no endereço do banco de memória 3
baa0000000040118
.