Eu tenho um FreeBSD com um RAID rodando 3 discos rígidos. Foi-me dado o desafio de monitorar seu RAID - Se um disco rígido falhar ou apresentar algum problema, preciso saber.
Então, a primeira coisa que estou fazendo agora é tentar entender como funciona o SmartCTL... Os comandos que usei até agora são:
smartctl --scan -j - To scan my devices and generated a JSON Structured list.
smartctl -i /dev/device_name - To list informations about a single device
smartctl -a /dev/your-device - More information like errors and etc (I think i can use this in some way to grep only errors sections...)
Existe algum outro parâmetro do SmartCTL que verifica se os discos são graváveis, vivos e têm seu status de integridade OK?
O principal objetivo deste entendimento é utilizar principalmente o SmartCTL para gerar dados que serão utilizados em um template de monitoramento pfSense RAID com Low Level Discovery for Zabbix Monitoring Software...
Qualquer ajuda é agradecida.
ok, então para responder - não há
smartctl --isDiskOK /dev/sda
abordagem que você possa adotar, tanto quanto eu sei.O smartctl mais próximo pode levá-lo a este é o relatório de contagem de setores realocados. Não vou explicar em detalhes, mas essencialmente quando os discos começam a falhar, os setores de difícil leitura/gravação serão realocados para um setor sobressalente. Se houver mais realocações acontecendo, significa que a unidade está mais perto de estar completamente morta.
crie o template zabbix com o seguinte item:
permitir que o usuário zabbix execute smartctl via sudoers:
atribua o modelo ao host monitorado + reinicie o zabbix_agent para carregar a configuração - seu item deve ser preenchido com a contagem de setores realocados
Lucro.. :)
de qualquer forma, o modelo zabbix também está disponível no meu GitHub https://github.com/RipperSK/zabbix-user-params/blob/master/hdd.reallocated.sectors/userparameter_hdd.reallocated.sectors.conf
desfrutar.