我们在具有 6GB RAM 的 VMWareEsx3.5(x64) 上运行 RedHat 3.4.6(x32)。一些 java 进程(包括 jboss)在后台运行。
问题是java进程消耗大量内存,有时它们会被OOM-killer杀死。当OOM-killer即将行动时,空闲物理内存非常低100MB-200MB,但swap没有被使用(99%空闲)。有时这也会导致内核恐慌。
- 那么为什么不使用交换呢?
- 如何调查这个内核恐慌?
- 在 32 位 Redhat 上使用 6GB 内存是否明智?
谢谢
我们在具有 6GB RAM 的 VMWareEsx3.5(x64) 上运行 RedHat 3.4.6(x32)。一些 java 进程(包括 jboss)在后台运行。
问题是java进程消耗大量内存,有时它们会被OOM-killer杀死。当OOM-killer即将行动时,空闲物理内存非常低100MB-200MB,但swap没有被使用(99%空闲)。有时这也会导致内核恐慌。
谢谢
就个人而言,我永远不会使用 PAE(32 位系统上超过 4G 的 RAM)。运行实际的 64 位内核和系统将获得更好的体验。
OOM 应该只在 malloc 可能失败时触发。(不是当你有很多可用的交换时)
32 位内核很可能是部分原因。PAE 使用不同的内存区域,可能不允许一个区域从另一个区域进行 malloc。
你有没有修改你的swappiness?(内核使用交换的容易程度。) cat /proc/sys/vm/swappiness ?
您还可以研究调整 vm.dirty_ratio 或 vm.lower_zone_protection = 100。
你捕捉到内核恐慌了吗?(串行控制台通常是执行此操作的好方法)
您也可以尝试使用自己的过程监控软件抢占 OOM-Killer。(看看Monit)
祝你好运
来自http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1002704
运行 Oracle/Java 的 RHEL4 虚拟机通过 OOM 杀手随机杀死进程详细信息 OOM 杀手会杀死应用程序,即使 ESX 未处于内存负载之下。命令 top 显示大量内存被缓存并且几乎没有使用交换。解决方案
当要复制的数据大小超过物理内存大小时,oom-killer 开始随机杀进程。
这可以通过运行来解决:
sysctl -w vm.lower_zone_protection 100
当 lower_zone_protection 设置为 100 时,它会将空闲页面阈值增加 100,从而更早地开始页面回收并防止 NFS(网络文件系统)远远落后于内核的内存需求。这会导致页面回收更快发生,从而为区域提供更多“保护”。Redhat 在 RHEL 中发现了此问题,他们在以下文章中提供了解决此问题的方法: