SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

Martin Smith

Asked: 2024-12-07 19:22:18 +0800 CST2024-12-07 19:22:18 +0800 CST 2024-12-07 19:22:18 +0800 CST

Por que o ponto de inflexão entre um plano serial e um paralelo não é exatamente o ponto em que o plano serial tem menor custo?

772

Para os dados de exemplo...


/*Quick and dirty generation of some rows of data*/
SELECT value as [orderid], 
       1 as [custid], 
       1 as [empid], 
       1 as [shipperid], 
       getdate() as [orderdate], 
       'abcdefgh' as [filler]
INTO dbo.Orders
FROM generate_series(1,10000000)

CREATE CLUSTERED INDEX [idx_cl_od] ON [dbo].[Orders]
(
    [orderdate] ASC
)

UPDATE STATISTICS dbo.Orders WITH FULLSCAN

E a seguinte consulta

SELECT [orderid], [custid], [empid], [shipperid], [orderdate], [filler]
FROM dbo.Orders
WHERE orderid <=7601715 AND 1=1 /*Prevent simple parameterisation*/

Então, na minha máquina de desenvolvimento (SQL Server 2022, DOP de 4), o custo de E/S da varredura de índice clusterizado é 46.8853independente do plano serial ou paralelo. E o custo de CPU da varredura está 11.0002no plano serial e 2.75004no paralelo. Então, eu esperava que o ponto de inflexão entre os planos fosse quando o operador de paralelismo excedesse 8.25016(um limite atingido quando as linhas estimadas que entram nele são em torno de 4,5 milhões). Na realidade, no ponto em que isso realmente ocorre, o custo para o operador de fluxos de coleta é 13.0501(em torno de 3 milhões de linhas a mais do que eu esperava).

Se o SQL Server não estiver usando o custo geral do plano como ponto de inflexão, qual é a lógica real?

( XML para planos estimados em pastetheplan )

1 respostas

Voted

Paul White · Answer 1 · 2024-12-08T00:09:41+08:00

Best Answer

Paul White

2024-12-08T00:09:41+08:002024-12-08T00:09:41+08:00

O ponto de inflexão é como você espera. As informações do showplan não refletem com precisão o custo do otimizador.

As duas primeiras consultas (paralela natural e serial hinted) têm um custo de 62,6855 na saída do otimizador.

O Showplan mostra um custo de 57,8855 para o plano serial (4,8 a menos).

A saída do otimizador para o plano serial tem um Filter acima do Scan. Este Filter é empurrado para baixo no Scan como um predicado residual (não SARG) por uma reescrita pós-otimização. A reescrita perde o custo do Filter.

Você pode ver o plano expandido (sem pushdown) usando o sinalizador de rastreamento 9130:

O Filtro tem um custo de 4,8.

8

Por que o ponto de inflexão entre um plano serial e um paralelo não é exatamente o ponto em que o plano serial tem menor custo?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Por que o ponto de inflexão entre um plano serial e um paralelo não é exatamente o ponto em que o plano serial tem menor custo?

1 respostas

relate perguntas