Erro de cabeçalho do MariaDB

Question

Codemonkey

Asked: 2024-03-27 20:26:52 +0800 CST2024-03-27 20:26:52 +0800 CST 2024-03-27 20:26:52 +0800 CST

O desempenho da consulta cai de um penhasco com JOINs adicionais - posso corrigir isso ajustando um parâmetro?

772

Executando 10.8.8-MariaDB-log

Tenho uma consulta muito complexa para um site de comparação.

Essencialmente

SELECT <columns> FROM <tables>
                 JOIN <derived table 1 for first comparison>
                 JOIN <derived table 2 for first comparison>
                 JOIN <derived table 1 for second comparison>
                 JOIN <derived table 2 for second comparison>

Funciona em <0,1s

Se eu mudar para

SELECT <columns> FROM <tables>
                 JOIN <derived table 1 for first comparison>
                 JOIN <derived table 2 for first comparison>
                 JOIN <derived table 1 for second comparison>
                 JOIN <derived table 2 for second comparison>
                 JOIN <derived table 1 for third comparison>
                 JOIN <derived table 2 for third comparison>

Demora mais de 10 segundos

Os índices são sólidos e o sql para criar as tabelas derivadas é o mesmo para cada comparação, exceto um valor de parâmetro de ID. Tudo o que muda é o número deles.

Eu suspeito que há algum buffer/cache que precisa ser aumentado um pouco? 🤷‍♂️

Sim , eu poderia reescrever a página/sql inteiramente para fazer isso por meio de um mecanismo muito diferente, mas se eu puder consertar isso com uma simples alteração de configuração, dados os recursos disponíveis na máquina, prefiro fazer isso. O tempo é curto.

Compreendo que isso possa ser um problema x/y, mas espero que haja um fruto fácil de alcançar que os mais experientes aqui sejam capazes de identificar imediatamente.

FWIW - filmando no escuro - tentei quadruplicar o tamanho desses três e não fez diferença:

join_buffer_size      = 32M (to 128M)
sort_buffer_size      = 4M  (to 16M)
read_rnd_buffer_size  = 4M  (to 16M)

Obrigado

2 respostas

Voted

Codemonkey · Answer 1 · 2024-03-28T03:46:35+08:00

TIL sobre STRAIGHT_JOIN.

STRAIGHT_JOINé como JOIN, exceto que diz ao otimizador de consulta para executar a consulta da maneira que você a criou.

Por que isso é importante? Fatoriais, basicamente.

O otimizador conhece muitos truques inteligentes para adivinhar o melhor plano de execução, mas ESSENCIALMENTE, a complexidade de trabalhar esse plano de execução segue um padrão fatorial.

1 mesa? 1 opção
2 mesas? 2 opções
3 mesas? 6 opções
4 mesas? 24 opções
5 mesas? 120 opções

No exemplo da minha pergunta original, eu tinha 14 tabelas. 87 bilhões de opções

E então 16 mesas. 2 TRILHÕES de opções

Como eu disse, o otimizador não é tão burro, pode podar muito e usar muitos atalhos, mas acho que os números ilustram o problema com MUITAS tabelas em uma consulta. O problema não é quanto tempo a consulta leva para ser executada, mas sim quanto tempo o otimizador leva para descobrir COMO executá-la.

Caso em questão. Tenho uma consulta que estou testando/mexendo na minha frente agora, com 18 tabelas.

Eu não fiz literalmente nada , a não ser substituir todos os meus JOINs por STRAIGHT_JOINs.

O resultado? Meu tempo de consulta caiu de 1,65s para 0,002s .

Rick James · Answer 2 · 2024-03-28T04:53:58+08:00

Rick James

2024-03-28T04:53:58+08:002024-03-28T04:53:58+08:00

Essa construção é péssima para o desempenho porque nenhuma das "tabelas derivadas" possui índices:

FROM ( SELECT ... ) a
JOIN ( SELECT ... ) b  ON ...
...

Então, sim, adicionar mais JOINé péssimo para o desempenho.

Não, você não pode sair do problema. (O ajuste pode ajudar, mas não é uma solução real.)

Vamos ver um mais completo SELECT, junto com alguns SHOW CREATE TABLEs; poderemos fornecer algumas sugestões construtivas.

0

O desempenho da consulta cai de um penhasco com JOINs adicionais - posso corrigir isso ajustando um parâmetro?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

O desempenho da consulta cai de um penhasco com JOINs adicionais - posso corrigir isso ajustando um parâmetro?

2 respostas

relate perguntas