Atualmente, usamos vários funcionários do Nagios para distribuir a carga de trabalho usando o DNZ, conforme descrito aqui: https://assets.nagios.com/downloads/general/docs/Distributed_Monitoring_Solutions.pdf . Não consegui encontrar nenhuma informação sobre isso na documentação oficial, e a maioria das pesquisas apenas me leva de volta ao site deles. Ignorando a potência de computação necessária (CPU, RAM etc.), existe algum limite rígido de quantos hosts ou serviços uma única instância do Nagios pode monitorar? E quanto a um trabalhador individual?
Não tenho certeza se você está perguntando sobre limites de configuração ou limites de tempo de execução. Ou ambos.
Se você está perguntando se há um limite para o número de objetos (hosts/serviços/comandos/contatos/qualquer coisa) que o analisador manipulará, parece que a resposta é "não" (observando a origem do analisador). A menos que você fique sem memória durante a análise.
À medida que você entra no território de dezenas de milhares de objetos (e mais), o tempo necessário para analisar a configuração pode aumentar drasticamente. No entanto, isso é mais um problema com a v3 do que com a v4. Consulte a página de documentos em Opções de inicialização rápida para obter mais informações.
Se você está perguntando sobre limitações de tempo de execução, novamente não há um limite superior pré-configurado ou codificado. A única coisa que realmente importa é checks/second , e se o seu hardware pode ou não lidar com isso. Nesse sentido, 10 mil hosts (ou serviços) com um intervalo de verificação de 5 minutos é o mesmo que 2 mil hosts/serviços com um intervalo de 1 minuto.
Observar (e tendências) as latências médias de verificação e os tempos de execução
nagiostats
é uma boa maneira de avaliar os problemas de capacidade do Nagios.Existem alguns ajustes simples que podem fazer grandes diferenças, como verificar os resultados do spool para um ramdisk e usar
check_icmp
em vez decheck_ping
. Há boas sugestões na página Tuning Nagios For Maximum Performance . (Mas essa página também sugere o uso de discos UltraSCSI em vez de IDE, para lhe dar uma ideia de quão atual é...)A razão pela qual você está tendo tantos problemas para encontrar informações definitivas sobre o dimensionamento do Nagios é que não há duas instalações iguais e há muitas variáveis para poder dizer "você pode ter X verificações por segundo por núcleo" ou algo semelhante.