我们有一台运行各种无头应用程序的服务器,例如 Java。它处理流数据、日常 python 脚本等。我们的一些应用程序有时会获得out of memory errors
.
我们遇到的问题是监控显示有大量内存。我们将其从 128GB 提升至 192GB,但仍未解决问题。我们的监控每 20 秒读取一次读数,并显示过去 2 天的最小可用内存为 132GB。但是今天早上我们有一些应用程序因内存不足错误而失败。是否有可能在有大量 ram 的情况下获得 OOM?
编辑:回答大卫的问题
- 是的,192GB 只是分配给操作系统的内存。它是一个虚拟机
- 监控将为操作系统读取免费/可用的 ram,我们没有任何每个进程的监控
- 大多数 java 进程不在 CLI 上指定内存要求(例如 Xmx 等)
- 异常是“线程“主”java.lang.OutOfMemoryError 中的异常:无法创建新的本机线程”
我要补充一点,多个进程同时失败。对我来说,这表明这不是流程本身的问题,而是与系统有关。一些失败的应用程序每天都在做同样的事情,即处理相当一致的数据流。他们不会被大量请求淹没。