Para obter uma lista mais abrangente de ferramentas de monitoramento e seus recursos, confira esta página da Wikipedia .
Como a pergunta indica, quais são as ferramentas mais usadas para essa tarefa e quais são seus pontos fortes e fracos?
Para obter uma lista mais abrangente de ferramentas de monitoramento e seus recursos, confira esta página da Wikipedia .
Como a pergunta indica, quais são as ferramentas mais usadas para essa tarefa e quais são seus pontos fortes e fracos?
Eu usei o Nagios no passado com sucesso. É muito extensível (mais de 200 add-ons), relativamente fácil de usar e muitos relatórios. Um negativo seria a configuração inicial.
O Cacti é um frontend baseado na web muito bom para o RRDTool , fornecendo gráficos e estatísticas muito úteis. RRDTool é a parte que reúne dados de vários sistemas e monitora uma ampla gama de dados técnicos.
Estamos usando essa solução cacti/RRDTool para monitorar sistemas Unix e Windows. Obtemos muitas métricas úteis, incluindo carga, uso de CPU/RAM, espaço em HD, usuários conectados, tráfego de rede, processos em execução e assim por diante.
Você encontrará mais informações sobre cactos na página O que é Cactos? página.
Pessoalmente, adoro o Munin , que é muito fácil de instalar e escrever plugins, pois tem uma arquitetura muito simples. Já existem muitos plugins para todos os propósitos que você possa imaginar, então você provavelmente nem precisará escrever plugins em primeiro lugar.
Ele também fornece belos gráficos e a opção de configurar alertas (muito básicos).
Zabbix . É de código aberto e razoavelmente simples de configurar e personalizar. Temos muitos scripts de monitoramento personalizados que alimentam o servidor zabbix, mas ele se encarrega de centralizar esses dados, exibi-los adequadamente, notificações (e-mail, IM, SMS, twitter, etc), e assim por diante.
Eu tenho feito lançamentos do Spiceworks em nossa empresa e estamos descobrindo que ele é uma ótima ferramenta não apenas para monitorar servidores, mas tudo o mais na rede.
Ele faz coisas como inventário automático e monitoramento personalizado para enviar e-mails quando há um problema (por exemplo: a impressora está com 10% de tinta ou o disco rígido deste servidor tem 20%).
Sua desvantagem provavelmente seria a densidade de informações por computador, não entenda errado, tem MUITOS dados por máquina, mas para coisas como servidores onde você pode querer muitas estatísticas, pode precisar usar outra ferramenta.
EDIT: oh, eu mencionei que seu modelo de negócios é baseado em ser gratuito para sempre.
O Smokeping não apenas verifica a disponibilidade de vários servidores e serviços, mas também acompanha sua latência, fornecendo gráficos fáceis de usar, bonitos e rápidos de exibir .
Uma ampla variedade de plug-ins de medição de latência está disponível imediatamente. Se você conhece algum Perl, é fácil criar seus próprios para quaisquer necessidades exóticas.
Grandes instalações se beneficiarão do sistema Master/Slave para medição distribuída.
O sistema de alerta altamente configurável ajudará você a detectar problemas antes que eles comecem a afetar os usuários ou evoluam para uma grande interrupção.
Smokeping é um software livre e de código aberto escrito em Perl por Tobi Oetiker, o criador do MRTG e RRDtool
Zenoss Core é de alguma utilidade, estamos usando (por cerca de um ano) para monitoramento leve de servidores, switches de rede e UPSs.
O OpenNMS é usado onde trabalho para monitorar mais de mil máquinas Linux. Monitoramos o hardware de cada máquina e os aplicativos executados nelas.
Eu usei:
O Nagios é ótimo, pois é gratuito e há muitos plugins para ele. No entanto, a interface do usuário e a configuração são muito difíceis.
É exatamente o oposto dos prós/contras, o que também é ótimo, é o Microsoft System Center Operations Manager (SCOM), que não é gratuito, tem menos plugins, mas a configuração e a configuração são brilhantes e fáceis.
Devo admitir que se eu estivesse em uma empresa principalmente da Microsoft, tivesse requisitos de confiança muito altos (ou seja, não pudesse permitir que o monitoramento quebrasse) ou tivesse que pensar em fazer com que os desenvolvedores trabalhassem com isso, o SCOM seria minha recomendação sobre o Nagios.