CentOS 上的 ES 1.7.x
我们的生产 ES 集群严重下降。我们丢失了整个索引。事实证明,这已经在日志中记录了一天或更长时间:
New used memory from field ### would be larger than configured breaker
好的。
我可以点击 ES 上的哪个 url 来查看问题是否正在发生?(日志监控不是我们监控机制的一部分,但访问 ES url 对我们来说很容易。)
我们现在使用集群健康 url,所以我们看到集群变成黄色/红色,但是(到目前为止),我们还没有看到如何从外部看到问题的到来(所以我们被打败了)。
好的,找到答案了。
坦率地说,这是一个非常薄弱的答案,给我们带来了真正的负担。
如此处所述:
https://www.elastic.co/guide/en/elasticsearch/reference/1.4/cluster-nodes-stats.html
用这个:
然后你可以看到一个breakers|tripped 元素。
那只是一个计数器,而不是一个速度。所以你必须:
如果 ES 可以计算出速度,那就太好了,所以我们可以只关注最后两点。
但这是那里最好的,就我目前所见。