(Abaixo está um cenário hipotético e essa pergunta me veio à mente quando descobri as complexidades do balanceamento de carga do gRPC e como ele não é eficiente devido à conexão TCP de longa duração)
Imagine que há um cliente HTTP que mantém uma única conexão TCP de longa duração para fazer solicitações HTTP 1.1 para um serviço de API localizado atrás do proxy HA. Existem vários servidores redundantes como parte do serviço e desejo equilibrar todas as solicitações na mesma conexão TCP em diferentes servidores upstream. Algo assim é possível?
Entendo que o cliente pode ter várias conexões abertas ao LB o que ajudará a causa.
Mas eu estou querendo saber se é possível fazer isso diretamente usando alguma configuração de proxy HA. Se não, por que esse recurso está faltando? É devido a algum tipo de limitação de protocolo de rede/HTTP? Ou esse recurso nunca foi necessário porque existem outras soluções alternativas?
Vamos supor que o TLS seja encerrado no proxy HA para que ele possa fazer o roteamento L7. Além disso, o HAProxy é apenas um exemplo, qualquer outro LB / Proxies como Envoy, Nginx que seja capaz desse recurso?