Eu executo uma build baseada em Xeon um pouco incomum como uma espécie de servidor de compilação/build/teste. Eu a testei inicialmente com um seasonic m12 620W. Eu queria uma PSU totalmente modular e peguei uma thermalright TR-TPFX650. Ela funciona bem - eu testei a carga com ambas as PSUs. Meu uso de energia para todo o sistema é de ~175w, mas isso é quase totalmente da CPU ou através da placa-mãe.
CPU Model : Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz
CPU Cores : 28 @ 1197.103 MHz
OS : Ubuntu 24.04.1 LTS
Especificações do sistema acima - e é a mesma placa-mãe MATX-CS612 desta pergunta
Com a última CPU - Ela reinicia em algum lugar entre 4 horas e 30 minutos, com o tempo ficando cada vez mais curto. Eu "inicio" novamente em cerca de 4 horas se eu deixar o PC desligado, e isso é bastante replicável. Só estou realmente ciente de que a máquina reinicia porque ela emite um bipe quando reinicia. Há algumas peculiaridades - não há registros óbvios do motivo da falha, o cockpit mostra a máquina como reinicializada.
Monitorei as temperaturas e elas nunca ultrapassaram 50c - e a máquina está estável com a outra PSU. Eu também testei o estresse/ciclo térmico da máquina como parte do processo de construção, então tenho 99% de certeza de que a CPU está bem. Tive mais de um dia de atividade em outra PSU, então acho que podemos descartar o superaquecimento.
Eu isolei definitivamente o problema na PSU.
A última reinicialização mostra várias inicializações como ativas - suspeito que isso seja devido a uma inicialização suja
reboot system boot 6.8.0-48-generic Wed Dec 25 15:46 - 23:29 (07:42)
reboot system boot 6.8.0-48-generic Tue Dec 24 19:29 - 21:36 (02:07)
reboot system boot 6.8.0-48-generic Tue Dec 24 18:45 - 21:36 (02:51)
reboot system boot 6.8.0-48-generic Tue Dec 24 18:41 - 18:44 (00:03)
reboot system boot 6.8.0-48-generic Tue Dec 24 14:25 - 18:44 (04:19)
reboot system boot 6.8.0-48-generic Wed Dec 18 09:04 - 09:05 (00:01)
reboot system boot 6.8.0-48-generic Wed Dec 18 08:29 - 09:05 (00:35)
reboot system boot 6.8.0-48-generic Tue Dec 17 19:58 - 20:03 (00:04)
O que estou tentando descobrir é se é uma questão de a PSU menor não se comportar com a configuração específica, ou se eu tenho uma PSU ruim. Tenho algumas ideias sobre testar a PSU em outros sistemas com uma CPU de menor potência, mas estou tentando entender o que estou vendo aqui, especialmente com os períodos de falha atrasados e encurtados.