Estou tentando habilitar o sysstat para fazer leituras de temperatura, para que eu tenha informações de temperatura anteriores para diagnosticar falhas de host no futuro.
Eu tentei este comando para obter informações de temperatura:
$ sar -m TEMP
Requested activities not available in file /var/log/sysstat/sa22
Aqui está o que a página man do sar tem a dizer sobre isso:
-m { keyword [,...] | ALL }
Report power management statistics. Note that these statistics depend on sadc's option "-S POWER" to
be collected.
Possible keywords are CPU, FAN, FREQ, IN, TEMP and USB.
[...]
With the TEMP keyword, statistics about devices temperature are reported. The following values are
displayed:
De acordo com isso, as informações de gerenciamento de energia (da qual a temperatura é um subconjunto) não são registradas por padrão. Então, eu mudei o arquivo /etc/sysstat/sysstat
para habilitá-lo. Eu mudei isso:
# Parameters for the system activity data collector (see sadc(8) manual page)
# which are used for the generation of log files.
# By default contains the `-S DISK' option responsible for generating disk
# statisitcs. Use `-S XALL' to collect all available statistics.
SADC_OPTIONS="-S DISK"
nisso:
SADC_OPTIONS="-S DISK,POWER"
Outro problema no rastreador de problemas do sysstat dizia que o sysstat requer lm-sensors para funcionar, então instalei esse pacote também. Aqui está a saída de sensors
:
$ sensors
acpitz-acpi-0
Adapter: ACPI interface
temp1: +27.8°C (crit = +119.0°C)
temp2: +29.8°C (crit = +119.0°C)
coretemp-isa-0000
Adapter: ISA adapter
Package id 0: +89.0°C (high = +82.0°C, crit = +100.0°C)
Core 0: +86.0°C (high = +82.0°C, crit = +100.0°C)
Core 1: +88.0°C (high = +82.0°C, crit = +100.0°C)
Core 2: +89.0°C (high = +82.0°C, crit = +100.0°C)
Core 3: +89.0°C (high = +82.0°C, crit = +100.0°C)
Core 4: +88.0°C (high = +82.0°C, crit = +100.0°C)
Core 5: +87.0°C (high = +82.0°C, crit = +100.0°C)
nvme-pci-0800
Adapter: PCI adapter
Composite: +38.9°C (low = -273.1°C, high = +84.8°C)
(crit = +84.8°C)
Sensor 1: +38.9°C (low = -273.1°C, high = +65261.8°C)
Sensor 2: +37.9°C (low = -273.1°C, high = +65261.8°C)
Portanto, isso parece detectar corretamente meus sensores de temperatura.
Também tentei esperar dez minutos para que outra coleta acontecesse. (Meu sistema está configurado para registrar a cada dez minutos, às :05, :15, :25, etc.)
Infelizmente, depois de tudo isso, ainda recebo o mesmo erro:
$ sar -m TEMP
Requested activities not available in file /var/log/sysstat/sa22