Em um servidor CentOS 7 (com kernel 3.10), fiquei surpreso ao descobrir que o processo mysqld foi "oom eliminado". O motivo era óbvio: às vezes executo um processo que consome muita memória (WebTorrent), que às vezes se transforma em uma abominação (parece um vazamento de memória). Por mim está tudo bem, desde que seja morto quando isso acontecer. Em outro sistema (Debian 11), esse era o comportamento real, mas aqui no antigo CentOS 7, outros processos são eliminados, mas não entendo por que não o mais óbvio?
Dos logs (apenas linhas selecionadas):
Apr 20 09:12:57 vps001 kernel: mysqld invoked oom-killer: gfp_mask=0x201da, order=0, oom_score_adj=0
Apr 20 09:12:58 vps001 kernel: Out of memory (oom_kill_allocating_task): Kill process 996 (mysqld) score 0 or sacrifice child
Apr 20 09:12:58 vps001 kernel: Killed process 918 (mysqld), UID 27, total-vm:2184052kB, anon-rss:18492kB, file-rss:0kB, shmem-rss:0kB
--
Apr 20 09:26:40 vps001 kernel: in:imjournal invoked oom-killer: gfp_mask=0x201da, order=0, oom_score_adj=0
Apr 20 09:26:40 vps001 kernel: Out of memory (oom_kill_allocating_task): Kill process 663 (in:imjournal) score 0 or sacrifice child
Apr 20 09:26:40 vps001 kernel: Killed process 653 (rsyslogd), UID 0, total-vm:308640kB, anon-rss:340kB, file-rss:0kB, shmem-rss:156kB
--
Apr 20 09:26:40 vps001 kernel: tmux invoked oom-killer: gfp_mask=0x201da, order=0, oom_score_adj=0
Apr 20 09:26:41 vps001 kernel: Out of memory (oom_kill_allocating_task): Kill process 23040 (tmux) score 0 or sacrifice child
Apr 20 09:26:41 vps001 kernel: Killed process 23041 (bash), UID 0, total-vm:115680kB, anon-rss:0kB, file-rss:4kB, shmem-rss:0kB
--
Apr 20 09:26:41 vps001 kernel: node invoked oom-killer: gfp_mask=0x200da, order=0, oom_score_adj=0
Apr 20 09:26:41 vps001 kernel: Out of memory (oom_kill_allocating_task): Kill process 23241 (node) score 0 or sacrifice child
Apr 20 09:26:41 vps001 kernel: Killed process 23239 (WebTorrent), UID 1000, total-vm:14750096kB, anon-rss:1618448kB, file-rss:0kB, shmem-rss:0kB
3 processos foram eliminados antes do bom, por razões que não consigo entender.
Coisas que eu esperaria:
- O processo que consome mais memória é eliminado
- Um processo com UID 0 não é eliminado antes de outro UID
- UID 27 é mais "importante" que UID 1000
Gostaria de entender melhor o comportamento do OOM e principalmente porque todas as minhas suposições estavam erradas sobre isso.
Lendo o código-fonte do kernel e agora vejo, é óbvio:
oom_kill_allocating_task
significa que nenhuma varredura é executada e o processo de solicitação é eliminado.Este não é o comportamento padrão e eu tive uma configuração do sysctl em algum lugar configurando-o:
Então devo ter definido isso há muito tempo sem entender as consequências. Obrigado por seus comentários.