AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / server / Perguntas / 980115
Accepted
dimisjim
dimisjim
Asked: 2019-08-22 01:38:22 +0800 CST2019-08-22 01:38:22 +0800 CST 2019-08-22 01:38:22 +0800 CST

Tempos limite ocasionais com agentes Zabbix por trás de um AWS Network Load Balancer

  • 772

Minha arquitetura na AWS é a seguinte:

Existem 2 agentes zabbix idênticos (baseados em zabbix/zabbix-agent:centos-4.0.11) cada um rodando em uma instância EC2 diferente. O servidor Zabbix é executado em uma terceira instância (também dockerizada com dockbix usando também a versão 4.0), todas as três dentro da mesma VPC.

A ideia é ter um Network Load Balancer que escute a porta que ambos os agentes executam (10050) e tenha essas 2 instâncias mencionadas sendo registradas no grupo de destino. Então, o DNS deste NLB seria fornecido para a configuração do host Zabbix como interface. O objetivo é ter vários hosts zabbix visando o mesmo NLB e suas solicitações sendo roteadas de acordo com a carga de tráfego para o agente diferente. Existe um item de agente zabbix em cada host que invoca um UserParameter (um script python) que é definido em cada um dos dois arquivos conf do agente zabbix.

Meu problema é o seguinte: zabbix_get (e a chamada equivalente feita automaticamente de acordo com o intervalo definido na conf do host) timeouts ocasionalmente. Uma vez eu recebo uma resposta bem sucedida

{"response":"sucesso","info":"processado: 4; falhou: 0; total: 4; segundos gastos: 0,000106"}

(script python usado é bem rápido, leva apenas 1 segundo) e outras vezes recebo uma resposta como:

zabbix_get [4515]: Tempo limite durante a execução da operação.

Isso acontece um após o outro. Então, um foi bem-sucedido e os próximos tempos limite, então o próximo foi bem-sucedido e assim por diante.

Eu tentei testar a conexão com telnet, e funciona o tempo todo. Eu até tentei usar um contêiner tcp echo simples, que também funcionou bem o tempo todo.

Qualquer idéia sobre o que pode estar errado seria muito apreciada :)

EDIT : Só queria observar que esse comportamento ocorre não apenas com meu script personalizado definido pelo UserParameter, mas também com chamadas de agente internas, como agent.versionou agent.pingou net.tcp.port[<serverIp>, 10051]etc

EDIT2 : Com tcpdump src <serverIp>a execução dentro das instâncias do agente, parece que há tráfego semelhante acontecendo com uma resposta bem-sucedida e com tempo limite

amazon-web-services
  • 1 1 respostas
  • 189 Views

1 respostas

  • Voted
  1. Best Answer
    dimisjim
    2019-08-22T04:35:51+08:002019-08-22T04:35:51+08:00

    Então, aparentemente, eu precisava habilitar o balanceamento de carga cross-AZ para meu nlb. É por isso que estava expirando a cada segunda solicitação, pois todas as minhas instâncias estavam em uma região de disponibilidade.

    • 0

relate perguntas

  • CentOS relatando menor memória total em comparação com outros na AWS

  • Como posso atualizar para o Java 1.8 em um Amazon Linux Server?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

    • 5 respostas
  • Marko Smith

    Ping uma porta específica

    • 18 respostas
  • Marko Smith

    Verifique se a porta está aberta ou fechada em um servidor Linux?

    • 7 respostas
  • Marko Smith

    Como automatizar o login SSH com senha?

    • 10 respostas
  • Marko Smith

    Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

    • 30 respostas
  • Marko Smith

    Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

    • 5 respostas
  • Marko Smith

    Qual porta o SFTP usa?

    • 6 respostas
  • Marko Smith

    Linha de comando para listar usuários em um grupo do Windows Active Directory?

    • 9 respostas
  • Marko Smith

    O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

    • 3 respostas
  • Marko Smith

    Como determinar se uma variável bash está vazia?

    • 15 respostas
  • Martin Hope
    Davie Ping uma porta específica 2009-10-09 01:57:50 +0800 CST
  • Martin Hope
    kernel O scp pode copiar diretórios recursivamente? 2011-04-29 20:24:45 +0800 CST
  • Martin Hope
    Robert ssh retorna "Proprietário incorreto ou permissões em ~/.ssh/config" 2011-03-30 10:15:48 +0800 CST
  • Martin Hope
    Eonil Como automatizar o login SSH com senha? 2011-03-02 03:07:12 +0800 CST
  • Martin Hope
    gunwin Como lidar com um servidor comprometido? 2011-01-03 13:31:27 +0800 CST
  • Martin Hope
    Tom Feiner Como posso classificar a saída du -h por tamanho 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent Como determinar se uma variável bash está vazia? 2009-05-13 09:54:48 +0800 CST

Hot tag

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve