AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 1338
Accepted
Jeremy Boyd
Jeremy Boyd
Asked: 2011-02-19 15:00:57 +0800 CST2011-02-19 15:00:57 +0800 CST 2011-02-19 15:00:57 +0800 CST

SELECT * WHERE VarCharColumn IN (...) Otimização

  • 772

Tenho uma lista de 3.000 strings e as estou passando (vinte por vez) para uma cláusula IN parametrizada. Definitivamente não está obtendo os resultados que eu gostaria de ver ~ 500ms por execução.

A coluna é um índice. Você conhece uma maneira melhor do que esta:

SELECT * FROM [ohb].[dbo].[MasterUrls] WITH (NOLOCK) WHERE Hash 
IN(@p0,@p1,@p2,@p3,@p4,@p5,@p6,@p7,@p8,@p9,@p10,@p11,@p12,@p13,@p14,@p15,@p16,@p17,@p18,@p19)

Uma lista de 3000 leva entre 3 e 5 minutos. Eu realmente preciso disso para cerca de 30 segundos. Isso é possível?

Estou usando o MSSQL 2008 R2 em um servidor com 24 GB de RAM e NUMA Xeons duplos de 8 núcleos a 2,4 Ghz rodando em um RAID 10 ISCSI de 6 HDD (@15k/rpm).

A tabela tem 1,4 milhão de linhas e o índice é um índice não clusterizado.

O plano de execução mostra a varredura de índice como 90% da execução total.

sql-server sql-server-2008
  • 4 4 respostas
  • 461 Views

4 respostas

  • Voted
  1. gbn
    2011-02-20T02:35:14+08:002011-02-20T02:35:14+08:00

    SELECT *invalidará qualquer uso ideal de um índice (não está cobrindo), mesmo que o hash seja indexado. Sua varredura de índice provavelmente está no índice clusterizado por causa disso.

    Pessoalmente, eu começaria com

    • colocando os 3000 valores de pesquisa em uma tabela com um índice
    • Editar: de acordo com o comentário de Marian, isso pode ser passado em uma lista ou tabela já
    • use isso em qualquer JOIN, IN, EXISTS (mesmo plano geralmente)
    • garantir meu índice nos ternos MasterUrls usando Hash e abrange col1, col2, col3

    Algo como

    CREATE TABLE #foo (Hash ...)
    INSERT #foo...
    CREATE INDEX IX_FOO ON #foo (hash)
    
    --either
    CREATE NONCLUSTERED INDEX IX_Hash ON MasterUrls (hash) INCLUDE (col1, col2, col3)
    --or    
    CREATE CLUSTERED INDEX IXC_Hash ON MasterUrls (hash)
    
    SELECT col1, col2, col3
    FROM [ohb].[dbo].[MasterUrls] M
    JOIN
    #foo F ON M.Hash = F.Hash
    
    • 7
  2. mrdenny
    2011-02-21T12:26:31+08:002011-02-21T12:26:31+08:00

    Passe os valores por meio de um parâmetro de valor de tabela. Desta forma, eles já estão em forma de tabela. Em seguida, copie os valores do TVP para uma tabela temporária, que contém um índice clusterizado. Use esta tabela temporária como um membro JOIN de sua consulta.

    Remova o SELECT * e altere-o para apenas as colunas necessárias, com as colunas adicionais incluídas. Se SELECT * for necessário, inclua todas as colunas adicionais como colunas incluídas no índice.

    • 3
  3. Ankit Bhalala
    2017-05-17T21:52:10+08:002017-05-17T21:52:10+08:00

    Sim: - Isso é possível, basta armazenar todos os id de passagem em uma string com valor separado por vírgula e fazer uma função:

    Basta seguir o passo:

    Primeiro faça uma função:

     ALTER FUNCTION [dbo].[UDF_IDListToTable]
     (
        @list          [varchar](MAX),
        @Seperator     CHAR(1)
      )
     RETURNS @tbl TABLE (ID INT)
     WITH 
    
     EXECUTE AS CALLER
     AS
      BEGIN
        DECLARE @position INT
        DECLARE @NewLine CHAR(2) 
        DECLARE @no INT
        SET @NewLine = CHAR(13) + CHAR(10)
    
        IF CHARINDEX(@Seperator, @list) = 0
        BEGIN
        INSERT INTO @tbl
        VALUES
          (
            @list
          )
    END
    ELSE
    BEGIN
        SET @position = 1
        SET @list = @list + @Seperator
        WHILE CHARINDEX(@Seperator, @list, @position) <> 0
        BEGIN
            SELECT @no = SUBSTRING(
                       @list,
                       @position,
                       CHARINDEX(@Seperator, @list, @position) - @position
                   )
    
            IF @no <> ''
                INSERT INTO @tbl
                VALUES
                  (
                    @no
                  )
    
            SET @position = CHARINDEX(@Seperator, @list, @position) + 1
        END
    END
    RETURN
    END
    

    depois disso, basta usar com junção interna: -

    SELECT  *
    FROM    [ohb].[dbo].[MasterUrls] AS mul WITH ( NOLOCK )
            INNER JOIN dbo.UDF_IDListToTable(@IDString, ',') udtl ON mul.hash = udtl.ID; 
    
    • 1
  4. Best Answer
    Jeremy Boyd
    2011-06-08T05:51:50+08:002011-06-08T05:51:50+08:00

    Na verdade, resolvi isso de uma maneira MUITO mais rápida e sem SQL.

    Em outra etapa antes desta, pego as URLs e IDs da tabela (em vez de apenas a URL, que eu usaria como hash para a pesquisa - esta pergunta), salvo-as na memória e, em seguida, no FS (no caso de falha na memória -- assíncrono, é claro), quando chegou a hora de fazer a pesquisa, li dos meus dados armazenados na memória/FS.

    O processo agora leva menos de 5 segundos em média para fazer uma pesquisa e atualizar (a etapa após esta pergunta) os dados de 3.000 linhas. Muito melhor do que 240 segundos em média.

    • -1

relate perguntas

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Quanto "Padding" coloco em meus índices?

  • Existe um processo do tipo "práticas recomendadas" para os desenvolvedores seguirem para alterações no banco de dados?

  • Como determinar se um Índice é necessário ou necessário

  • Downgrade do SQL Server 2008 para 2005

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve