Quais são as principais causas de deadlocks e podem ser evitadas?

Question

wootscootinboogie

Asked: 2013-04-01 13:44:35 +0800 CST2013-04-01 13:44:35 +0800 CST 2013-04-01 13:44:35 +0800 CST

Por que um operador de correspondência de hash nesta consulta básica

772

Estou começando a aprender um pouco sobre como analisar planos de execução e tornar as consultas mais eficientes

Considere estas duas consultas básicas

select distinct pat_id, drug_class, drug_name from rx 

select pat_id, drug_class, drug_name from rx

e seus planos de execução

insira a descrição da imagem aqui

índice usado:

CREATE CLUSTERED INDEX [ix_overlap] ON [dbo].[rx] 
(
    [pat_id] ASC,
    [fill_date] ASC,
    [script_end_date] ASC,
    [drug_name] ASC
)

Embora a primeira consulta supostamente tenha o custo mais alto por uma margem de 4:1, ela é executada mais rapidamente que a segunda. Por que um distinto simples adicionado à consulta adicionará o operador de correspondência de hash (o que suponho ser sempre ruim, correções são bem-vindas)? E por que ela tem o custo de consulta mais alto em relação à segunda consulta se for executada mais rapidamente?

1 respostas

Voted

Mark Storey-Smith · Answer 1 · 2013-04-01T14:11:25+08:00

A primeira consulta está usando um plano paralelo, o que significa que o "trabalho" foi dividido em várias tarefas executadas por vários threads. O tempo de CPU cumulativo foi, portanto, maior do que para o plano serial usado para sua segunda consulta.

Quanto ao motivo pelo qual o distinto faz com que o operador de correspondência de hash apareça no plano; uma operação de agregação ou classificação é necessária para determinar o DISTINCTresultado. @SQL_Kiwi pode aparecer com uma explicação mais aprofundada em breve, mas o operador de correspondência de hash é aparentemente preferido para conjuntos de resultados maiores.

O otimizador tende a preferir o Hash Match Aggregate em conjuntos de linhas maiores, com menos grupos, onde não há razão para produzir uma saída classificada e onde as linhas de entrada não são classificadas nas expressões DISTINCT. Entradas maiores favorecem a correspondência de hash porque o algoritmo geralmente escala bem (embora exija uma concessão de memória) e pode fazer bom uso do paralelismo. Menos grupos são melhores para hash porque significa menos entradas na tabela de hash, e a memória necessária para armazenar valores únicos é proporcional ao número de grupos (e ao tamanho do grupo). A correspondência de hash não requer nem preserva a ordem do fluxo de linha de entrada. [Fonte]

Por que um operador de correspondência de hash nesta consulta básica

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Conceder acesso a todas as tabelas para um usuário

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Por que um operador de correspondência de hash nesta consulta básica

1 respostas

relate perguntas