Quais são as principais causas de deadlocks e podem ser evitadas?

Question

Jeremy Boyd

Asked: 2011-02-19 15:00:57 +0800 CST2011-02-19 15:00:57 +0800 CST 2011-02-19 15:00:57 +0800 CST

SELECT * WHERE VarCharColumn IN (...) Otimização

772

Tenho uma lista de 3.000 strings e as estou passando (vinte por vez) para uma cláusula IN parametrizada. Definitivamente não está obtendo os resultados que eu gostaria de ver ~ 500ms por execução.

A coluna é um índice. Você conhece uma maneira melhor do que esta:

SELECT * FROM [ohb].[dbo].[MasterUrls] WITH (NOLOCK) WHERE Hash 
IN(@p0,@p1,@p2,@p3,@p4,@p5,@p6,@p7,@p8,@p9,@p10,@p11,@p12,@p13,@p14,@p15,@p16,@p17,@p18,@p19)

Uma lista de 3000 leva entre 3 e 5 minutos. Eu realmente preciso disso para cerca de 30 segundos. Isso é possível?

Estou usando o MSSQL 2008 R2 em um servidor com 24 GB de RAM e NUMA Xeons duplos de 8 núcleos a 2,4 Ghz rodando em um RAID 10 ISCSI de 6 HDD (@15k/rpm).

A tabela tem 1,4 milhão de linhas e o índice é um índice não clusterizado.

O plano de execução mostra a varredura de índice como 90% da execução total.

4 respostas

Voted

gbn · Answer 1 · 2011-02-20T02:35:14+08:00

gbn

2011-02-20T02:35:14+08:002011-02-20T02:35:14+08:00

SELECT *invalidará qualquer uso ideal de um índice (não está cobrindo), mesmo que o hash seja indexado. Sua varredura de índice provavelmente está no índice clusterizado por causa disso.

Pessoalmente, eu começaria com

colocando os 3000 valores de pesquisa em uma tabela com um índice
Editar: de acordo com o comentário de Marian, isso pode ser passado em uma lista ou tabela já
use isso em qualquer JOIN, IN, EXISTS (mesmo plano geralmente)
garantir meu índice nos ternos MasterUrls usando Hash e abrange col1, col2, col3

Algo como

CREATE TABLE #foo (Hash ...)
INSERT #foo...
CREATE INDEX IX_FOO ON #foo (hash)

--either
CREATE NONCLUSTERED INDEX IX_Hash ON MasterUrls (hash) INCLUDE (col1, col2, col3)
--or    
CREATE CLUSTERED INDEX IXC_Hash ON MasterUrls (hash)

SELECT col1, col2, col3
FROM [ohb].[dbo].[MasterUrls] M
JOIN
#foo F ON M.Hash = F.Hash

7

mrdenny · Answer 2 · 2011-02-21T12:26:31+08:00

mrdenny

2011-02-21T12:26:31+08:002011-02-21T12:26:31+08:00

Passe os valores por meio de um parâmetro de valor de tabela. Desta forma, eles já estão em forma de tabela. Em seguida, copie os valores do TVP para uma tabela temporária, que contém um índice clusterizado. Use esta tabela temporária como um membro JOIN de sua consulta.

Remova o SELECT * e altere-o para apenas as colunas necessárias, com as colunas adicionais incluídas. Se SELECT * for necessário, inclua todas as colunas adicionais como colunas incluídas no índice.

3

Ankit Bhalala · Answer 3 · 2017-05-17T21:52:10+08:00

Sim: - Isso é possível, basta armazenar todos os id de passagem em uma string com valor separado por vírgula e fazer uma função:

Basta seguir o passo:

Primeiro faça uma função:

 ALTER FUNCTION [dbo].[UDF_IDListToTable]
 (
    @list          [varchar](MAX),
    @Seperator     CHAR(1)
  )
 RETURNS @tbl TABLE (ID INT)
 WITH 

 EXECUTE AS CALLER
 AS
  BEGIN
    DECLARE @position INT
    DECLARE @NewLine CHAR(2) 
    DECLARE @no INT
    SET @NewLine = CHAR(13) + CHAR(10)

    IF CHARINDEX(@Seperator, @list) = 0
    BEGIN
    INSERT INTO @tbl
    VALUES
      (
        @list
      )
END
ELSE
BEGIN
    SET @position = 1
    SET @list = @list + @Seperator
    WHILE CHARINDEX(@Seperator, @list, @position) <> 0
    BEGIN
        SELECT @no = SUBSTRING(
                   @list,
                   @position,
                   CHARINDEX(@Seperator, @list, @position) - @position
               )

        IF @no <> ''
            INSERT INTO @tbl
            VALUES
              (
                @no
              )

        SET @position = CHARINDEX(@Seperator, @list, @position) + 1
    END
END
RETURN
END

depois disso, basta usar com junção interna: -

SELECT  *
FROM    [ohb].[dbo].[MasterUrls] AS mul WITH ( NOLOCK )
        INNER JOIN dbo.UDF_IDListToTable(@IDString, ',') udtl ON mul.hash = udtl.ID;

Jeremy Boyd · Answer 4 · 2011-06-08T05:51:50+08:00

Best Answer

Jeremy Boyd

2011-06-08T05:51:50+08:002011-06-08T05:51:50+08:00

Na verdade, resolvi isso de uma maneira MUITO mais rápida e sem SQL.

Em outra etapa antes desta, pego as URLs e IDs da tabela (em vez de apenas a URL, que eu usaria como hash para a pesquisa - esta pergunta), salvo-as na memória e, em seguida, no FS (no caso de falha na memória -- assíncrono, é claro), quando chegou a hora de fazer a pesquisa, li dos meus dados armazenados na memória/FS.

O processo agora leva menos de 5 segundos em média para fazer uma pesquisa e atualizar (a etapa após esta pergunta) os dados de 3.000 linhas. Muito melhor do que 240 segundos em média.

-1

SELECT * WHERE VarCharColumn IN (...) Otimização

Como você mysqldump tabela (s) específica (s)?

Como você mostra o SQL em execução em um banco de dados Oracle?

Como selecionar a primeira linha de cada grupo?

Listar os privilégios do banco de dados usando o psql

Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

Como uso currval() no PostgreSQL para obter o último id inserido?

Como executar o psql no Mac OS X?

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Passando parâmetros de array para um procedimento armazenado

SELECT * WHERE VarCharColumn IN (...) Otimização

4 respostas

relate perguntas