AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 33521
Accepted
njvds
njvds
Asked: 2013-01-25 16:31:54 +0800 CST2013-01-25 16:31:54 +0800 CST 2013-01-25 16:31:54 +0800 CST

Problema de desempenho da consulta

  • 772

Eu tenho esta consulta abaixo que está se comportando de forma estranha. bem estranho no sentido de que não consegui encontrar uma explicação completa para isso.

Versão: Sql Server 2008 R2 Enterprise

Sem fragmentação. Estatísticas atualizadas com fullscan e para todos os índices.

DECLARE @t TABLE (
  subid INT )

INSERT INTO @t
VALUES     (7)--,(3)


SELECT TOP 1 t.QueueItemID
FROM   QueueTable t
WHERE  t.IsProcessed = 0
       AND t.QCode = 'USA'
       AND SubID IN (SELECT SubID
                     FROM   @t)
ORDER  BY t.QueueItemID 

Um pouco sobre o esquema:

Variável de tabela (@t) é apenas um subid de coluna.

O esquema da QueueTable é:

CREATE TABLE [dbo].[QueueTable](
    [QueueItemID] [int] IDENTITY(1,1) NOT NULL,
    [SubID] [int] NOT NULL,
    [IsProcessed] [bit] NOT NULL,
    [Qload] [varchar](max) NOT NULL,
    [QCode] [varchar](5) NOT NULL,
    [QDesc] [varchar](max) NULL,
 CONSTRAINT [PK_QueueTable] PRIMARY KEY CLUSTERED 
(
    [QueueItemID] ASC
)

Esta tabela é tão grande quanto as colunas do tipo varchar(max) no esquema acima.

Existem 2 índices NC:

  1. NC index NCx_1 on (isprocessed,qcode) include(queueitemid,subid)

  2. NC index NCx_2 on (subid,isprocessed,qcode) include(queueitemid)

A contagem total de linhas é de cerca de 9 milhões de linhas. O grupo por subid está abaixo:

SubID   RowCount
------  --------
1   68
2   8255571
3   378584
7   5350
11  5318

As linhas que satisfazem a condição (t.IsProcessed = 0 e t.QCode = 'USA') estão em torno de 350k.

Quando executo a consulta acima, leva 1,5 segundo para ser concluída com a busca em NC NCx_1 e, em seguida, digitalizo a variável de tabela. Aqui está o plano.

Plano de consulta

O plano acima é para subid = 11 ou 7 na variável de tabela @t Não sei por que não está usando o índice NCx_2 (subid, isprocessed, qcode) include (queueitemid) que corresponde aos critérios. Em vez disso, ele está usando o índice NCX_1.

Parece que está procurando cerca de 350 mil linhas para satisfazer (t.IsProcessed = 0 e t.QCode = 'USA' ) e, em seguida, filtrando os dados com base na coluna subid.

Eu esperaria que primeiro filtrasse os dados com base na coluna subid (o que seria muito menor) e, em seguida, aplicasse outros filtros, exatamente para o que serve o NCX_2.

Eu tentei algumas otimizações aqui que melhoraram o desempenho, mas quero entender esse comportamento estranho pelo menos para mim.

  1. Quando adiciono dica de junção de mesclagem na consulta, a consulta é executada muito rapidamente (100 ms)
  2. Quando adiciono dica de índice (NCX_2) na consulta, a consulta também é executada muito rapidamente (60 ms)
  3. Quando modifico a consulta para fazer MIN(t.QueueItemID) e removo a ordem por consulta novamente, é executado muito rápido (60 ms)

Não sei por que o otimizador não o escolheu por padrão.

t-sql sql-server-2008-r2
  • 1 1 respostas
  • 380 Views

1 respostas

  • Voted
  1. Best Answer
    Martin Smith
    2013-01-27T05:45:55+08:002013-01-27T05:45:55+08:00

    Você diz

    O plano acima é para subid = 11 ou 7 na variável de tabela @t

    Eu acho que você pode estar sob um equívoco aqui. O SQL Server não examina o conteúdo da variável de tabela e escolhe um plano com base nos valores que ela contém.

    A instrução é compilada antes que a variável da tabela contenha quaisquer linhas e você obterá o mesmo plano (que assume uma única linha), independentemente de conter eventualmente 2(e corresponderia a 95,5% das linhas) ou 1(e corresponderia apenas a 0.0008%) .

    A variável da tabela também pode conter várias linhas, mas o SQL Server não levará em conta isso, exceto se você usar a OPTION (RECOMPILE)dica e, mesmo assim, não houver estatísticas nas variáveis ​​da tabela, portanto, não poderá levar em consideração os valores reais.

    Alguns planos alternativos estão abaixo

    plano 1

    plano 2

    Isso requer encontrar todas as linhas correspondentes e classificá-las.

    Como NCx_1não é declarado como um índice exclusivo, ele include(QueueItemID)é ignorado (conforme explicado em Mais sobre chaves de índice não clusterizado ) e , em vez disso, é adicionado como uma coluna de chaveQueueItemID de índice . Isso significa que o SQL Server pode buscar on e as linhas correspondentes serão ordenadas por .IsProcessed, QCodeQueueItemID

    O plano em sua pergunta, portanto, evita uma operação de classificação, mas o desempenho depende inteiramente de quantas linhas na prática precisam ser avaliadas antes que a primeira correspondente ao SubID IN (SELECT SubID FROM @t)predicado seja encontrada e a busca de intervalo possa parar.

    Claro que isto pode variar muito dependendo de quão comuns são os SubIDvalores contidos em @te se existe alguma distorção na distribuição destes valores em relação a QueueItemID(Você diz que cerca de 350k linhas correspondem ao predicado de busca e que cerca de 350k acabam sendo procurados então SubID = 7, parece que todas estão no final ou talvez nenhuma linha corresponda - o que seria o pior caso para este plano).

    Seria interessante saber qual é o número estimado de linhas que saem da busca. Presumivelmente, isso é muito menos do que 350.000 e, portanto, o SQL Server escolhe o plano que você vê com base nesse custo estimado.

    Se a variável da tabela sempre tiver apenas algumas linhas, você pode achar que essa reescrita funciona melhor para você.

    SELECT TOP 1 QueueItemID
    FROM   @t
           CROSS APPLY (SELECT TOP 1 t.QueueItemID
                        FROM   QueueTable t
                        WHERE  t.IsProcessed = 0
                               AND t.QCode = 'USA'
                               AND SubID = [@t].SubID
                        ORDER  BY t.QueueItemID) CA 
    ORDER BY QueueItemID   
    

    Para mim, dá o plano abaixo, onde ele busca o índice subid,isprocessed,qcode,queueitemidquantas vezes você tiver linhas na variável da tabela. É semelhante ao primeiro plano mostrado, mas pode ser um pouco mais eficiente, pois cada busca é interrompida após o retorno da primeira linha.

    plano

    • 4

relate perguntas

  • plano de manutenção executado pelo agente

  • MS SQL: Use o valor calculado para calcular outros valores

  • Como posso saber se um banco de dados SQL Server ainda está sendo usado?

  • Implementando uma consulta PIVOT

  • Randomizando o conteúdo da tabela e armazenando-o de volta na tabela

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Conceder acesso a todas as tabelas para um usuário

    • 5 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve