Eu instalei zabbix-server
, zabbix-proxy
e alguns zabbix-agent
s em alguns dos meus servidores dedicados. Tudo está funcionando e estou muito feliz com tudo, mas fiquei curioso sobre este tópico: processos de monitoramento .
O que eu quero:
Eu gostaria que o Zabbix monitorasse os processos (uso de cpu e ram, uptime, etc.) sempre da mesma forma que monitora tráfego de rede, uso de CPU, etc.
Até aqui:
Pesquisando no Google, descobri que é possível criar um script personalizado que você pode executar para poder dizer ao script para fazer o que quiser, mas estou tentando realizar algo diferente aqui, como você deve ter notado no seção acima
Pergunta:
Então, é possível fazer isso de qualquer maneira? Se sim, por onde devo começar?
Parece que você gostaria de monitorar o estado do processo e o uso de recursos. Nesse caso, as seguintes chaves de agente podem ajudar:
proc.num
- pode monitorar o número de processos, com base no nome do processo, usuário, parâmetros, etc.proc.mem
- pode monitorar o uso de memória do processo (processo único ou um grupo deles)proc.cpu.util
- pode monitorar a utilização da CPU do processo (processo único ou um grupo deles)Consulte https://www.zabbix.com/documentation/3.0/manual/config/items/itemtypes/zabbix_agent para obter mais informações sobre essas chaves de item.
Em relação à representação gráfica, todos os itens individuais podem ser representados imediatamente clicando no link "Gráfico" na página de dados mais recente. Gráficos personalizados também podem ser criados na configuração, incluindo vários itens. Observe que isso não é diferente de nenhum outro item numérico no Zabbix e não é específico do item de processo.
Mais formas de monitorar processos do AIX, linux, etc...
Item:
Uma alternativa é usar o
system.run command [ps -ef | grep ora_pmon | grep -iv grep | wc -l]
, neste exemplo estou monitorando o processo Oracle pmon.Acionar:
Quando o valor do trigger for igual a 0 ele alerta que o processo não está rodando!
{servername: system.run [ps -ef | grep ora_pmon | grep -iv grep | wc -l] .last (# 120)} = 0