O comando dmesg --level=emerg,alert,crit,err
lista todas as mensagens de erro com alta gravidade.
Fiquei pensando, para fins de monitoramento, se a contagem de mensagens é de alguma forma exposta no /proc
sistema de arquivos. Seria ótimo dar uma indicação de problemas de hardware.