Eu tenho um servidor fluentd que está processando uma média de 1000 req/s. Este servidor é composto por 32 cpus. Neste servidor estão rodando 32 containers docker fluentes com a mesma configuração. O ponto de entrada do servidor é um nginx como balanceador de carga configurado com algoritmo round-robin e enviado para os diferentes contêineres. Ambos, contêineres e nginx, escutam em 24224/tcp.
A entrada desses nós são 6 aplicativos C# que usam fluent-logger-csharp para enviar ao servidor fluentd. Assim, para cada app abre uma conexão com o Fluentd Server e devido ao grande tráfego, o app mantém o socket aberto. Isso faz com que apenas 6 de 32 dockers estejam processando solicitações.
Como você poderia usar melhor a utilização do servidor sem modificar o cliente C#?