Desliguei um servidor web antigo e imediatamente comecei a receber notificações DOWN do Naemon.
Agora eu removi esse host inteiramente da configuração do Naemon e reiniciei o serviço do Naemon. No entanto, continuo recebendo notificações DOWN a cada hora.
Como faço para parar estes?
Toda a configuração do Naemon tem quase 2.000 linhas, muito longa para incluir aqui; o naemon.cfg praticamente padrão tem mais de 1000 linhas.
Existe algum parâmetro(s) fazendo com que um host seja salvo em algum cache? Posso encontrar o host listado em/var/lib/naemon/status.dat
Este tópico e post resolveram o problema para mim:
https://support.nagios.com/forum/viewtopic.php?f=7&t=32630&sid=7cd3fc62673fec6539b082de7c1bb7c5&start=10#p136526
Não há "cache oculto" ou parâmetro para isso; a configuração 100% define quais hosts/serviços são verificados.
O problema era que o Naemon não estava desligando corretamente por algum motivo desconhecido. Eu estava usando
systemctl restart naemon
- e atésystemctl stop naemon
seguido porsystemctl start naemon
todos os nossos nós do Naemon.Mas agora, quando verifiquei
ps -ef | grep naemon
depois de desligar o Naemon, vi que ainda havia processos em execução. Eu os matei comkill -9 <parent pid>
, e iniciei o Naemon novamente. Não há mais notificações DOWN!