Ping uma porta específica

Question

D34DM347

Asked: 2015-10-08 05:43:54 +0800 CST2015-10-08 05:43:54 +0800 CST 2015-10-08 05:43:54 +0800 CST

F5 LTM freqüentemente mata processos com SIGKILL

772

Temos um dispositivo BIP-IP 6400 LTM que está matando processos com uma frequência alarmante. A CPU está consistentemente em torno de 23% de utilização, então isso não é um problema.

Aqui está uma amostra de /var/log/ltm:

Oct  7 08:21:55 local/pri-4600 info bigd[3471]: reap_child: child process PID = 25338 exited with signal = 9
Oct  7 08:22:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 25587 exited with signal = 9
Oct  7 08:22:34 local/pri-4600 info bigd[3471]: reap_child: child process PID = 25793 exited with signal = 9
Oct  7 08:23:10 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26260 exited with signal = 9
Oct  7 08:23:36 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26584 exited with signal = 9
Oct  7 08:23:40 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26647 exited with signal = 9
Oct  7 08:23:45 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26699 exited with signal = 9
Oct  7 08:23:55 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26805 exited with signal = 9
Oct  7 08:25:36 local/pri-4600 info bigd[3471]: reap_child: child process PID = 28079 exited with signal = 9
Oct  7 08:27:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 29286 exited with signal = 9
Oct  7 08:27:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 29307 exited with signal = 9
Oct  7 08:27:56 local/pri-4600 info bigd[3471]: reap_child: child process PID = 29793 exited with signal = 9
Oct  7 08:29:20 local/pri-4600 info bigd[3471]: reap_child: child process PID = 30851 exited with signal = 9
Oct  7 08:33:00 local/pri-4600 info bigd[3471]: reap_child: child process PID = 1122 exited with signal = 9
Oct  7 08:33:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 1299 exited with signal = 9
Oct  7 08:34:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 2054 exited with signal = 9
Oct  7 08:35:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 2784 exited with signal = 9
Oct  7 08:35:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 2807 exited with signal = 9
Oct  7 08:35:35 local/pri-4600 info bigd[3471]: reap_child: child process PID = 3015 exited with signal = 9
Oct  7 08:36:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 3601 exited with signal = 9

Isso é normal? Se não, o que poderia estar causando isso acontecer?

2 respostas

Voted

Jason Rahm · Answer 1 · 2015-10-20T11:31:52+08:00

Jason Rahm

2015-10-20T11:31:52+08:002015-10-20T11:31:52+08:00

bigd é o daemon de monitoramento no BIG-IP e, portanto, parece que um monitor em uso está travando. Você deve abrir um caso com o suporte e enviar seu qkview para ihealth.f5.com. Aqui está uma solução relacionada a essa mensagem de erro:

https://support.f5.com/kb/en-us/solutions/public/17000/000/sol17092.html

1

D34DM347 · Answer 2 · 2016-01-01T09:07:16+08:00

Best Answer

D34DM347

2016-01-01T09:07:16+08:002016-01-01T09:07:16+08:00

Este era um bug conhecido no software BIG-IP 10.2.4 que estávamos executando.

Do suporte F5:

...você atingiu um problema conhecido rastreado internamente como: bug ID539130 "bigd pode travar durante o processamento SIGCHLD causando falha de pulsação bigd e SIGABRT" -=Condição=- Monitores externos que funcionam por um longo tempo e são eliminados pela próxima iteração do monitor, pode causar a falha do bigd e do núcleo, isso causa um lapso temporário no monitoramento da integridade.

A correção foi atualizar o software com Hotfix-BIGIP-10.2.4-HF12-866.11-ENG.

1

F5 LTM freqüentemente mata processos com SIGKILL

Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?