Eu tenho um aplicativo multithread que escuta eventos e precisa responder a eles instantaneamente .
Com o aplicativo em execução, meu servidor está com menos de 5% de carga da CPU em um servidor de 1 núcleo.
Eu me pergunto, aumentar o número de threads em que meu servidor diminuiria o tempo de resposta?
Parece intuitivo, mas só para ter certeza.
Depende de como o aplicativo da web é escrito. Em geral não, não há benefício para uma única solicitação.
Agora vamos detalhar um pouco. Problemas que podem ser paralelizados têm uma parte que não pode ser paralelizada e você fica preso a isso, não importa quantos threads você esteja adicionando.
Após um determinado número de threads, você poderá ter um desempenho pior devido à sobrecarga ou ao gerenciamento dos threads.
Você não pode executar mais threads ao mesmo tempo do que núcleos físicos da CPU.
Você poderá obter um ganho de desempenho se ativar o hyper-threading.
A maioria dos aplicativos de servidor web executa cada solicitação em um único thread. Você pode ter um thread separado para solicitações de banco de dados ou outros trabalhos, mas em geral cada solicitação é executada por um único thread.
Se você usa outros serviços e seu objetivo é diminuir a latência do seu aplicativo, diminuir o número de threads paralelos pode, na verdade, levar a um aumento de desempenho, pois você evita gargalos causados por muitas solicitações sendo executadas em paralelo.
Referência TL;DR. Micro benchmarks e benchmarks reais e full stack.
Deixe que isso fique claro: 9 mulheres não conseguem dar à luz em um mês.