Quais são as principais causas de deadlocks e podem ser evitadas?

Question

Vojtěch Dohnal

Asked: 2017-02-28 05:17:36 +0800 CST2017-02-28 05:17:36 +0800 CST 2017-02-28 05:17:36 +0800 CST

Usar a variável de tabela em vez da tabela temporária torna a execução da consulta lenta

772

Eu tenho uma tabela com dados históricos sobre carros AutoDatacom chave agrupada combinada Cas(DateTime) + GCom(Car ID). Um registro contém vários indicadores, como nível de combustível, estado do veículo etc.

Os intervalos entre os registros individuais de um carro na AutoDatatabela são irregulares, às vezes são 120 segundos, às vezes poucos segundos, às vezes horas etc. Preciso normalizar os registros para visualização, para que mostre um registro a cada 30 segundos.

Tenho o seguinte script:

DECLARE @GCom int = 2563,
    @Od DateTime2(0) = '20170210', 
    @Do DateTime2(0) = '20170224'    

--Create a table with intervals by 30 seconds
declare @temp Table ([cas] datetime2(0))
INSERT @temp([cas])
SELECT d
FROM
(
  SELECT
      d = DATEADD(SECOND, (rn - 1)*30, @Od)
  FROM 
  (
      SELECT TOP (DATEDIFF(MINUTE, @Od, @Do)*2) 
          rn = ROW_NUMBER() OVER (ORDER BY s1.[object_id])
      FROM
          sys.all_objects AS s1
      CROSS JOIN
          sys.all_objects AS s2
      ORDER BY
          s1.[object_id]
  ) AS x
) AS y;

--Create temp table
CREATE TABLE #AutoData (
    [Cas] [datetime2](0) NOT NULL PRIMARY KEY,
    [IDProvozniRezim] [tinyint] NOT NULL,
    [IDRidic] [smallint] NULL,
    [Stav] [tinyint] NOT NULL,
    [Klicek] [bit] NOT NULL,
    [Alarm] [bit] NOT NULL,
    [MAlarm] [tinyint] NOT NULL,
    [DAlarm] [bit] NOT NULL,
    [Bypass] [bit] NOT NULL,
    [Lat] [real] NULL,
    [Lon] [real] NULL,
    [ObjemAktualni] [real] NOT NULL,
    [RychlostMaxV1] [real] NOT NULL,
    [RychlostV2] [real] NOT NULL,
    [Otacky] [smallint] NOT NULL,
    [Nadspotreba] [real] NOT NULL,
    [Vzdalenost] [real] NOT NULL,
    [Motor] [smallint] NOT NULL
)

--Populate the temp table selecting only relevant AutoData records
INSERT INTO #AutoData
SELECT [Cas]
      ,[IDProvozniRezim]
      ,[IDRidic]
      ,[Stav]
      ,[Klicek]
      ,[Alarm]
      ,[MAlarm]
      ,[DAlarm]
      ,[Bypass]
      ,[Lat]
      ,[Lon]
      ,[ObjemAktualni]
      ,[RychlostMaxV1]
      ,[RychlostV2]
      ,[Otacky]
      ,[Nadspotreba]
      ,[Vzdalenost]
      ,[Motor]
FROM AutoData a 
WHERE a.GCom = @GCom AND a.cas BETWEEN @Od AND @do

--Select final data
SELECT t.cas, ad.malarm, ad.IDProvoznirezim, ad.Otacky, ad.motor, ad.objemAktualni, ad.Nadspotreba 
FROM @temp t
OUTER APPLY (
SELECT TOP 1 stav, malarm, otacky,motor, objemAktualni, Nadspotreba, IDProvoznirezim  FROM #AutoData a
                     WHERE DATEDIFF(SECOND, a.cas, t.cas)<=CASE WHEN Motor>120 THEN Motor ELSE 120 END 
                     AND DATEDIFF(SECOND,  a.cas, t.cas)>-30 
                     ORDER BY CASE WHEN DATEDIFF(SECOND, a.cas, t.cas)>0 THEN DATEDIFF(SECOND, a.cas, t.cas) ELSE (DATEDIFF(SECOND, a.cas, t.cas)*-1) +120 END
) ad

DROP TABLE #AutoData

A princípio tentei escrever o script com apenas uma variável de tabela @temp colocando a condição WHERE a.GCom = @GCom AND a.cas BETWEEN @Od AND @dona última seleção. O script levou 39 segundos para ser executado.

Quando eu usei #AutoDataa tabela temporária para pré-carregar o subconjunto de dados em uma tabela temporária como é mostrado no script acima, ele caiu para 5 segundos.

Então eu tentei usar uma variável de tabela @AutoDataem vez de #AutoData- mas levou muito mais tempo - 22 segundos.

@temptable tem 40320 registros e #AutoDatatable tem 1904 registros para este exemplo. Mas, surpreendentemente, apenas usar #temptabela em vez de @tempvariável tornou a execução lenta novamente.

Fiquei surpreso ao ver essas diferenças usando ou não a tabela/variável temporária. Aparentemente, o SQL Server não pôde por si só otimizar o interior da cláusula OUTER APPLY.

Mas por que há uma diferença tão grande usando variáveis de tabela versus tabelas temporárias? Existe alguma outra maneira de saber, o que usar e não apenas tentar?

Plano de execução com tabela temporária #AutoData:

https://www.brentozar.com/pastetheplan/?id=B1y2x2Zcg

Plano de execução com a variável @AutoData:

https://www.brentozar.com/pastetheplan/?id=r1rAZnbqx

2 respostas

Voted

Brent Ozar · Answer 1 · 2017-02-28T05:47:42+08:00

A chave está nesta parte da sua pergunta:

A tabela @temp tem 40320 registros

No plano de execução, passe o mouse sobre a varredura da tabela @temp. Compare o número estimado de linhas com o número real de linhas. (Se você quiser postar o plano em http://PasteThePlan.com , podemos fornecer detalhes mais específicos. Isenção de responsabilidade: esse é o site da minha empresa.)

Você verá que o número estimado de linhas é muito baixo.

O SQL Server estima que 1-3 linhas retornarão de uma variável de tabela (dependendo da sua versão do SQL Server, estimador de cardinalidade, sinalizadores de rastreamento etc.) Isso, por sua vez, fornece um plano de execução muito ruim porque o SQL Server subestima a quantidade de trabalho precisará de outras tabelas, quanta memória reservar, etc.

Aqui estão as duas maneiras mais populares de obter uma estimativa mais precisa:

Tente uma tabela temporária (e observe as linhas estimadas versus reais no plano)
Use OPTION (RECOMPILE) em sua consulta - o que fornecerá uma estimativa muito mais precisa, mas com algumas desvantagens muito grandes em relação à visibilidade do cache do plano e ao uso da CPU

Para me ver fazendo isso ao vivo, assista ao Watch Brent Tune Queries de 1 hora (disclaimer: sou eu, linkando para um vídeo meu) onde pego uma consulta do Stack Overflow que usa uma variável de tabela e a ajusto ao vivo na frente de um audiência no SQL Rally Noruega.

paparazzo · Answer 2 · 2017-02-28T05:32:58+08:00

O planejador de consultas é mais eficiente com #temp. Em uma variável de tabela, ela considera apenas as primeiras linhas.

Sua variável de tabela (e #temp se você usar uma) provavelmente se beneficiaria de declarar uma chave primária.

Coloque uma chave em #AutoData e preencha apenas as linhas necessárias.

Classifique por chave à medida que adiciona linhas .

Eu suspeito que abaixo pode ser otimizado com um row_number()

SELECT t.cas
     , ad.malarm, ad.IDProvoznirezim, ad.Otacky
     , ad.motor, ad.objemAktualni, ad.Nadspotreba 
FROM @temp t
OUTER APPLY ( SELECT TOP 1 malarm, IDProvoznirezim, Otacky
                         , motor, objemAktualni, Nadspotreba   
               FROM #AutoData a
              WHERE DATEDIFF(SECOND, a.cas, t.cas) <= CASE WHEN Motor > 120 THEN Motor ELSE 120 END 
                AND DATEDIFF(SECOND, a.cas, t.cas)  > -30 
              ORDER BY CASE WHEN DATEDIFF(SECOND, a.cas, t.cas) > 0 THEN DATEDIFF(SECOND, a.cas, t.cas) 
                            ELSE DATEDIFF(SECOND, t.cas, a.cas) + 120 END
            ) ad

Esta é uma tentativa como row_number()

select * from 
( SELECT t.cas
       , a.malarm, a.IDProvoznirezim, a.Otacky
       , a.motor, a.objemAktualni, a.Nadspotreba 
       , row_nunber() over (partition by t.cas 
                            ORDER BY CASE WHEN DATEDIFF(SECOND, a.cas, t.cas) > 0 THEN DATEDIFF(SECOND, a.cas, t.cas) 
                            ELSE DATEDIFF(SECOND, t.cas, a.cas) + 120 END) rn
    FROM @temp t  -- with primay key t.cas order by
    join AutoData a
      on a.GCom = @GCom 
     AND a.cas BETWEEN @Od AND @do
     AND DATEDIFF(SECOND, a.cas, t.cas) <= CASE WHEN Motor > 120 THEN Motor ELSE 120 END 
     AND DATEDIFF(SECOND, a.cas, t.cas)  > -30 
) ad 
where ad.rn = 1

Usar a variável de tabela em vez da tabela temporária torna a execução da consulta lenta

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Usar a variável de tabela em vez da tabela temporária torna a execução da consulta lenta

2 respostas

relate perguntas