Extraia um valor entre 2 tubos

Question

Merlin Nestler

Asked: 2025-01-14 00:40:36 +0800 CST2025-01-14 00:40:36 +0800 CST 2025-01-14 00:40:36 +0800 CST

Por que a ordem das colunas no índice tem um impacto tão grande neste caso?

772

Recentemente, alterei um índice em uma tabela e vi uma perda enorme no desempenho de uma consulta. Gostaria de entender por que isso aconteceu.

Esta é a consulta. A chave estrangeira assim como Frome Toestão mudando, mas o resto permanece e é repetido frequentemente.

SELECT COUNT(*) 
FROM Table_With_Values 
WHERE FK_ObjectTheValuesBelongTo_Id = 460 
AND [From]>=CONVERT([datetime2](3),'07.10.2024 00:00:00',(104)) 
AND [To]<=CONVERT([datetime2](3),'08.10.2024 00:00:00',(104))

A princípio, o índice da tabela TableWithValuesparecia com isto:

CREATE NONCLUSTERED INDEX [Idx_TableWithValues_Fk_ObjectTheValuesBelongTo_Id_From_To] ON [dbo].[TableWithValues]
(
    [Fk_ObjectTheValuesBelongTo_Id] ASC,
    [From] ASC,
    [To] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, OPTIMIZE_FOR_SEQUENTIAL_KEY = OFF) ON [PRIMARY]

Então li a documentação do SQL Server e vi isto:

Considere a ordem das colunas se o índice contiver várias colunas. A coluna que é usada na cláusula WHERE em uma condição de pesquisa igual a (=), maior que (>), menor que (<) ou BETWEEN, ou participa de uma junção, deve ser colocada primeiro. Colunas adicionais devem ser ordenadas com base em seu nível de distinção, ou seja, da mais distinta para a menos distinta .

As colunas Fromand Totêm cerca de 140.000 valores distintos, enquanto a coluna foreign key tem apenas 1.600. Portanto, decidi mudar a ordem delas e fiz o índice ficar assim:

CREATE NONCLUSTERED INDEX [Idx_TableWithValues_From_To_Fk_ObjectTheValuesBelongTo_Id] ON [dbo].[TableWithValues]
(
    [From] ASC,
    [To] ASC,
    [Fk_ObjectTheValuesBelongTo_Id] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, OPTIMIZE_FOR_SEQUENTIAL_KEY = OFF) ON [PRIMARY]

No entanto, isso fez com que o desempenho dessa consulta se deteriorasse. Levou 1.000 vezes mais tempo para ser executado. Sei disso porque ativei o repositório de consultas em uma cópia do banco de dados. Então executei o sistema de TI que envia as consultas e verifiquei o valor avg_durationda tabela query_store_runtime_stats.

A tabela em si se parece com isso:

CREATE TABLE [dbo].[TableWithValues](
    [Id] [bigint] IDENTITY(1,1) NOT NULL,
    [Fk_ObjectTheValuesBelongTo_Id] [int] NOT NULL,
    [Value] [decimal](9, 3) NOT NULL,
    [From] [smalldatetime] NOT NULL,
    [To] [smalldatetime] NOT NULL,
 CONSTRAINT [Pk_TableWithValues_Id] PRIMARY KEY NONCLUSTERED 
(
    [Id] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, OPTIMIZE_FOR_SEQUENTIAL_KEY = OFF) ON [PRIMARY],
 CONSTRAINT [Uq_TableWithValues_ObjectTheValuesBelongTo_Id_From] UNIQUE NONCLUSTERED 
(
    [Fk_ObjectTheValuesBelongTo_Id] ASC,
    [From] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, OPTIMIZE_FOR_SEQUENTIAL_KEY = OFF) ON [PRIMARY]
) ON [PRIMARY]
GO

ALTER TABLE [dbo].[TableWithValues]  WITH CHECK ADD  CONSTRAINT [Fk_TableWithValues_ObjectTheValuesBelongTo_Id] FOREIGN KEY([Fk_ObjectTheValuesBelongTo_Id])
REFERENCES [dbo].[ObjectTheValuesBelongTo] ([Id])
GO

O plano de consulta para execuções com ambos os índices parece quase o mesmo. Há duas diferenças. Eles usam índices diferentes (ocultos na captura de tela) e as porcentagens são 13% e 87% (Fk first in Index) em um caso e 20% e 80% (Fk last in index) no outro.

Alguém tem alguma ideia de por que meu banco de dados não se comporta como seria de se esperar ao ler a documentação?

1 respostas

Voted

Charlieface · Answer 1 · 2025-01-14T01:00:51+08:00

Você perdeu o resto do parágrafo, que explica indiretamente a melhor maneira de indexar.

Adicionei numeração para que você possa ver o que ele está tentando dizer:

Considere a ordem das colunas se o índice contiver múltiplas colunas. A coluna que é usada na WHEREcláusula em:

um igual a (=)

maior que (>), menor que (<) ou condição de pesquisa BETWEEN

ou participa de uma junção

deve ser colocado primeiro.

Colunas adicionais devem ser ordenadas com base em seu nível de distinção, ou seja, da mais distinta para a menos distinta.

Então, no seu caso, FK_ObjectTheValuesBelongTo_Idé uma igualdade, então vai primeiro. Isso é independente de quão distinta ela é. Mesmo se for uma bitcoluna, se for uma igualdade, ela vai primeiro.

Na minha opinião, a decisão sobre outras colunas (desigualdade, junção e outras) depende principalmente de se há requisitos de consulta para agrupamento e classificação, e qual é a cardinalidade do resultado após os predicados de desigualdade. Se a tabela for grande e o predicado estiver filtrando muito, classificar novamente mais tarde não importará, enquanto que se estiver removendo apenas uma pequena porcentagem, a classificação posterior será lenta e precisará do índice para otimização.

Quaisquer outras colunas que não estejam sendo pesquisadas, apenas selecionadas, devem estar noINCLUDE , não na chave. A ordem não importa.

E se você tiver duas ou mais desigualdades ou unir colunas, então você não pode indexar para ambas. Você precisa decidir qual vai filtrar melhor, então coloque o resto das colunas como INCLUDEs.

Então o melhor índice é

(
    [Fk_ObjectTheValuesBelongTo_Id] ASC,
    [From] ASC
) INCLUDE (
    [To]
)

ou

(
    [Fk_ObjectTheValuesBelongTo_Id] ASC,
    [To] DESC
) INCLUDE (
    [From]
)

Além disso, o índice não está sendo buscado corretamente, porque você está passando a datetime2em vez de smalldatetime. Você precisa usar o tipo correto.

Por que a ordem das colunas no índice tem um impacto tão grande neste caso?

O C++20 mudou para permitir a conversão de `type(&)[N]` de matriz de limites conhecidos para `type(&)[]` de matriz de limites desconhecidos?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Por que a ordem das colunas no índice tem um impacto tão grande neste caso?

1 respostas

relate perguntas