ES 1.7.x no CentOS
Nosso cluster ES de produção caiu muito. Perdemos todo o índice. Acontece que isso estava nos logs por um dia ou mais:
New used memory from field ### would be larger than configured breaker
OK.
Qual url no ES posso acessar para ver se os problemas estão acontecendo? (Monitoramento de log não faz parte do nosso regime de monitoramento, mas acessar um URL ES é fácil para nós.)
Usamos urls de saúde do cluster agora, então vemos o cluster ficar amarelo/vermelho, mas (até agora), não vimos como ver externamente os problemas chegando (então somos derrotados).
OK, encontrei a resposta.
Francamente, é uma resposta muito fraca, que coloca um verdadeiro fardo sobre nós.
Conforme documentado aqui:
https://www.elastic.co/guide/en/elasticsearch/reference/1.4/cluster-nodes-stats.html
Usa isto:
E então você pode ver um disjuntor | elemento disparado.
Isso é apenas um contador, não uma velocidade. Então você tem que:
Seria muito bom se o ES pudesse calcular a velocidade, para que pudéssemos nos concentrar apenas nesses dois últimos pontos.
Mas este é o melhor que existe, pelo que posso ver até agora.