SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

J. Mini

Asked: 2024-10-10 18:54:41 +0800 CST2024-10-10 18:54:41 +0800 CST 2024-10-10 18:54:41 +0800 CST

As junções em heaps são um problema de desempenho se sempre podemos forçar uma junção hash?

772

Claramente tenho um equívoco, mas nenhuma quantidade de documentação de consultoria resolveu isso. Considere o seguinte argumento:

Geralmente nos preocupamos em unir heaps, porque classificá-los costuma ser mais caro do que ter um índice agrupado.
Junções hash não requerem classificações.
Do exposto acima, concluímos que você não deve se preocupar em unir heaps se você sempre puder obter (ou forçar) uma junção hash.

O desdém popular por montes sugere que o que foi dito acima está errado, mas onde está errado?

1 respostas

Voted

J.D. · Answer 1 · 2024-10-10T20:42:16+08:00

O desdém popular por montes sugere que o que foi dito acima está errado, mas onde está errado?

Isto está errado:

Do exposto acima, concluímos que você não deve se preocupar em unir heaps se você sempre puder obter (ou forçar) uma junção hash.

Só porque você não precisa classificar o Heap não significa que você não se beneficiaria de ele ser filtrado ou de alguma outra operação em que pesquisas classificadas contra ele seriam mais rápidas. Você corre o risco de fazer hash da tabela inteira se uma operação de filtro não puder ser aplicada antes no plano e o Heap inteiro acabar sendo escaneado.

Com um índice clusterizado, pelo menos é possível ser procurado ou escaneado de forma mais eficiente, reduzindo a quantidade de dados sendo operados anteriormente no plano. Então, o que é hash é um conjunto de dados muito menor, tornando-o uma operação mais rápida e eficiente.

Pelo menos esse é um exemplo.

Outra razão mais simplista é que você não deve sempre confiar em HASH JOINs como sua operação de junção física porque nem sempre é a maneira mais eficiente de unir dois conjuntos de dados. Ao fazer isso, você joga fora 2/3 das outras maneiras do mecanismo de unir seus dados de forma potencialmente mais eficiente.

As junções em heaps são um problema de desempenho se sempre podemos forçar uma junção hash?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

As junções em heaps são um problema de desempenho se sempre podemos forçar uma junção hash?

1 respostas

relate perguntas