AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / server / Perguntas / 995234
Accepted
Halfgaar
Halfgaar
Asked: 2019-12-12 10:14:34 +0800 CST2019-12-12 10:14:34 +0800 CST 2019-12-12 10:14:34 +0800 CST

Servidor de repente tem alto uso de CPU softirq após a reinicialização

  • 772

Um servidor virtual de 48 GB de RAM mantendo cerca de 25 mil conexões TCP (dispositivos em campo fazendo login para configurar um túnel SSH) ficou sem RAM e começou a trocar, ficando lento etc. Atualizamos e reinicializamos. Mesmo depois que as 25k conexões foram restauradas e a tempestade inicial de DDOS foi resolvida, o servidor agora mostrava uma enorme quantidade de uso do softirq. Como encontro a causa?

Aqui você pode ver os eventos:

Gráfico de CPU Munin

É impressionante que não costumava haver muito softirq. Agora, existem 8 threads do kernel fazendo cerca de 60% da CPU ( ksoftirqdthreads).

Olhando para os gráficos de Munin, vejo que as interrupções de PCI-MSI 49153-edge virtio0-input.0aumentaram muito (cuidado com a escala log y):

Munin interrompe gráficos

A quantidade de tráfego de rede com a qual a máquina tem que lidar realmente não mudou.

Eu escrevi um script python rápido que mostra as interrupções por segundo, a cada segundo, /proc/interruptsde PCI-MSI 49153-edge virtio0-input.0, e geralmente é cerca de 50 a 100 por segundo, mas de vez em quando, há uma rajada de 5000 a 10000.

Porque no processo de atualização, o painel de controle do hoster da VM anunciou que precisava migrar a VM para outro servidor. Eu teorizei que esse servidor tem um controlador Ethernet diferente, controlador de interrupção emulado de maneira diferente ou qualquer outra coisa, mas eles até migraram a VM de volta e não há diferença.

Outra diferença é que a VM passou de vmlinuz-4.15.0-45-genericpara /boot/vmlinuz-4.15.0-72-generic. Com todos os patches de CPU da Intel ultimamente, posso imaginar algo escondido lá.

A grande questão é: como chegar à causa raiz ou obter mais informações de onde vêm essas interrupções? A reinicialização do servidor para o kernel antigo é possível, mas não desejável.

linux
  • 1 1 respostas
  • 1958 Views

1 respostas

  • Voted
  1. Best Answer
    Halfgaar
    2020-01-18T15:55:13+08:002020-01-18T15:55:13+08:00

    Acontece que alguém instalou no topo, que tem um serviço systemd que coleta informações de contabilidade de processo. Removê-lo corrigiu.

    • 1

relate perguntas

  • Como descobrir detalhes sobre hardware na máquina Linux?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

    • 5 respostas
  • Marko Smith

    Ping uma porta específica

    • 18 respostas
  • Marko Smith

    Verifique se a porta está aberta ou fechada em um servidor Linux?

    • 7 respostas
  • Marko Smith

    Como automatizar o login SSH com senha?

    • 10 respostas
  • Marko Smith

    Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

    • 30 respostas
  • Marko Smith

    Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

    • 5 respostas
  • Marko Smith

    Qual porta o SFTP usa?

    • 6 respostas
  • Marko Smith

    Linha de comando para listar usuários em um grupo do Windows Active Directory?

    • 9 respostas
  • Marko Smith

    O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

    • 3 respostas
  • Marko Smith

    Como determinar se uma variável bash está vazia?

    • 15 respostas
  • Martin Hope
    Davie Ping uma porta específica 2009-10-09 01:57:50 +0800 CST
  • Martin Hope
    kernel O scp pode copiar diretórios recursivamente? 2011-04-29 20:24:45 +0800 CST
  • Martin Hope
    Robert ssh retorna "Proprietário incorreto ou permissões em ~/.ssh/config" 2011-03-30 10:15:48 +0800 CST
  • Martin Hope
    Eonil Como automatizar o login SSH com senha? 2011-03-02 03:07:12 +0800 CST
  • Martin Hope
    gunwin Como lidar com um servidor comprometido? 2011-01-03 13:31:27 +0800 CST
  • Martin Hope
    Tom Feiner Como posso classificar a saída du -h por tamanho 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent Como determinar se uma variável bash está vazia? 2009-05-13 09:54:48 +0800 CST

Hot tag

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve