我的系统是一个带有内核 2.6.32-5-openvz-amd64 的 Debian 6.0.3 x86_64 盒子,它托管了许多 OpenVZ 容器。我最近从 LXC/较新的内核从 backports repo 迁移到稳定的 OpenVZ 内核以解决网络问题但遇到了另一个问题 - CPU 花费大量时间处理软件中断。这是 CPU 时间的 Munin 图:http: //prntscr.com/arjzl。
我将nohz=off
and添加highres=off
到内核命令行,但这并没有太大帮助。而且,根据另一个 Munin 图:http ://prntscr.com/ark19,此框上的中断数量非常低,因此中断似乎不是导致此问题的原因。当我运行时top
,zabbix_server
是最多的 CPU 消耗者,但我看不出zabbix_server
和软件中断之间有任何关系。
我不确定如何进行调查,这对我来说看起来像是内核错误或内核模块错误,但我不知道如何将其追踪到有罪的进程/模块。也许还有另一个内核命令行参数需要调整。接下来我应该尝试什么?
我想知道你究竟是如何尝试看到一种关系的?例如,您是否尝试过停止它?
由于此问题是在内核更改后出现的,因此可以合理地假设这是 OVZ 2.6.32-5 的错误。我建议使用http://wiki.openvz.org/Download/kernel/rhel6/042stab055.16如果它比你当前的更新(看起来)。