AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 254877
Accepted
Artashes  Khachatryan
Artashes Khachatryan
Asked: 2019-12-06 03:20:54 +0800 CST2019-12-06 03:20:54 +0800 CST 2019-12-06 03:20:54 +0800 CST

SQL Server escolhe índice não seletivo

  • 772

Eu estava testando índices do SQL Server e encontrei um comportamento muito estranho. Aqui está o meu código:

DROP TABLE IF EXISTS  dbo._Test
DROP TABLE IF EXISTS  dbo._Newtest
GO
CREATE TABLE _Test(
ID INT NOT NULL, 
UserSystemID INT NOT NULL, 
Age INT
)
GO
INSERT INTO dbo._Test
        ( ID, UserSystemID, Age )

SELECT TOP 10000000 ABS(CHECKSUM(NEWID())) % 5000000, ABS(CHECKSUM(NEWID())) % 2, ABS(CHECKSUM(NEWID())) % 100
FROM sys.all_columns
CROSS JOIN sys.all_objects a
CROSS JOIN sys.all_objects b
CROSS JOIN sys.all_objects c

; WITH cte AS (
SELECT ID, UserSystemID,  age, ROW_NUMBER() OVER(PARTITION BY ID, UserSystemID ORDER BY GETDATE()) rn
FROM dbo._Test
)

SELECT cte.ID ,
       cte.UserSystemID ,
       cte.Age
INTO _newTest
FROM cte
WHERE cte.rn = 1

CREATE UNIQUE NONCLUSTERED INDEX  IX_test ON dbo._NewTest(ID, UserSystemID) INCLUDE(age)
GO
ALTER TABLE dbo._NewTest ADD CONSTRAINT PK_NewTest PRIMARY KEY CLUSTERED(UserSystemID, ID)
GO

Neste ponto, tenho dois índices na mesma tabela e nas mesmas colunas. O primeiro é não clusterizado e o segundo é clusterizado. A Idcoluna é mais seletiva (cerca de 5.000.000 valores únicos) e UserSystemIDnão (dois valores únicos).

Em seguida, executo a seguinte consulta para testar qual índice é usado:

SELECT id,  UserSystemID, age   
FROM _NewTest
WHERE id = 1502945
AND UserSystemID = 1

Ele busca o índice clusterizado. Você pode ver o plano aqui .

A questão é por que o SQL Server prefere o índice clusterizado em vez do índice exclusivo não clusterizado.


Minha coluna principal de índice clusterizado é muito menos seletiva do que o outro índice exclusivo não clusterizado. Portanto, espero que o desempenho seja pior com o índice clusterizado, mas na prática não é.

sql-server index
  • 1 1 respostas
  • 272 Views

1 respostas

  • Voted
  1. Best Answer
    Paul White
    2019-12-06T03:38:28+08:002019-12-06T03:38:28+08:00

    Dados os índices exclusivos, sua consulta selecionará no máximo uma linha.

    O otimizador sabe que precisará descer o índice b-tree apenas uma vez e não precisará varrer para frente ou para trás a partir desse ponto para encontrar mais correspondências. Isso é conhecido como busca singleton (teste de igualdade em um índice único).

    A implementação de correspondência de índice atual sempre escolhe o índice clusterizado quando pode usar uma busca singleton.

    A escolha entre índice clusterizado e não clusterizado aqui geralmente não é muito importante. Pode haver um pequeno custo extra à medida que os níveis superiores da b-tree são navegados (usando busca binária ou interpolação linear), mas isso seria um desafio até mesmo para medir. Lembre-se que apenas os componentes IDe UserSystemIDchave estão presentes em páginas de índice não folha.

    Pode-se argumentar que as páginas de folha de índice clusterizado mais amplas são menos propensas a estar na memória, em média. Existem algumas outras consequências de casos extremos, mas não vejo esse comportamento sendo alterado tão cedo.

    Mas minha coluna principal de índice clusterizado é muito menos seletiva do que o outro índice exclusivo não clusterizado. Portanto, espero que o desempenho seja pior com o índice clusterizado, mas na prática não é.

    A seletividade não importa para a busca de igualdade em um índice composto de árvore b.

    Seu índice composto clusterizado exclusivo tem chaves (UserSystemID, id).

    Para localizar uma linha com (UserSystemID = 1 e id = 1502945), o SQL Server não encontra todas as linhas em que UserSystemID = 1 e, em seguida, localiza as linhas em que id = 1502945. Isso seria muito ineficiente.

    Você pode dizer quantas páginas sua consulta de teste toca usando SET STATISTICS IO ON. Seu exemplo cria um índice clusterizado com dois níveis não-folha. No total, encontrar a linha desejada significa tocar em três páginas - uma em cada nível do índice.

    As linhas são ordenadas no índice por UserSystemID e id. Minha cópia da sua tabela de demonstração tem o seguinte layout na página raiz (nível superior) do índice clusterizado:

    página raiz

    Realizar uma pesquisa binária nesta página é fácil:

    • Comece na linha do meio.
    • Compare o UserSystemID com o que você está procurando.
      • Se não for igual, continue a pesquisa binária da maneira usual (escolha um novo ponto médio nas linhas anteriores ou posteriores, conforme apropriado).
      • Se igual em UserSystemID, compare o id com o que você está procurando e continue a pesquisa binária

    Seguindo essa lógica, encontraremos rapidamente a página de índice filho (próximo nível inferior) em que as chaves pesquisadas serão encontradas, se estiverem presentes. Repita a pesquisa binária nessa página e assim por diante até chegarmos à única página em nível de folha que deve conter a linha que estamos procurando, se ela existir.

    • 11

relate perguntas

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Quanto "Padding" coloco em meus índices?

  • Como determinar se um Índice é necessário ou necessário

  • O que significa "índice" em RDBMSs? [fechado]

  • Como criar um índice condicional no MySQL?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve