Eu tenho uma consulta estruturalmente "simples" que consiste basicamente nessas cláusulas:
SELECT
[650 columns here]
FROM
MAIN_TABLE
(Several Joins)
WHERE
(Some conditions in MAIN_TABLE plus some others)
Como alguém pode dizer, a projeção da coluna é bastante grande. Quando digo que a consulta é "simples", quero dizer que ela possui poucas (3) subconsultas na SELECT
cláusula que são bastante diretas. Fora isso, não possui CTE's, sub-seleções em cláusulas Join, agrupamento, classificação e assim por diante.
Esta consulta está oscilando entre 20 e 25 segundos para ser concluída.
Agora, se eu começar a extrair aleatoriamente algumas dessas colunas, em algum momento, o desempenho da consulta melhora repentina e significativamente (de 20s para 1-2s).
Se eu exportar o banco de dados (que é pequeno agora, nova implantação, tamanho total de aproximadamente 1 Gb) e executar a mesma consulta na minha máquina de desenvolvimento, ela será executada ainda mais rápido: 0,5s
Suponho que, até certo ponto, o mecanismo deve usar algum buffer de disco como armazenamento intermediário antes de buscar os resultados. O que me incomoda é que essa modificação de seleção de coluna altera tanto o desempenho interno do plano de consulta (ou seja, as tabelas de início da consulta em si) sem motivo aparente.
Como posso diagnosticar corretamente o que está acontecendo e resolver esse problema - algum conselho?
Mais informações
- PostgreSQL Versão 14.5
- SO: Rocky Linux 9.0 (Blue Onyx)
- Os parâmetros são seguidos com base na sugestão do pgTune - o servidor tem muito mais CPU/RAM do que o necessário até agora
- Já configurei o parâmetro WORK_MEM para um valor grande (100x o original) para uma sessão, mesmo resultado.
Plano de consulta rápida (limite de 10.000 linhas adicionado)