AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 178114
Accepted
Sir Swears-a-lot
Sir Swears-a-lot
Asked: 2017-07-06 14:14:23 +0800 CST2017-07-06 14:14:23 +0800 CST 2017-07-06 14:14:23 +0800 CST

Insira muito mais devagar quando a tabela de destino tiver um índice clusterizado

  • 772

Acabei de depurar um problema que me deixou completamente confuso.

Um processo de transformação ETL em nosso data warehouse de desenvolvimento acabou de falhar depois de trabalhar com sucesso todos os dias por meses. O mesmo trabalho do SSIS chamando o mesmo proc armazenado, com o mesmo esquema de tabela, índices e dados funciona bem na produção.

Esta etapa normalmente levaria menos de 2 min. Hoje, depois de 4 horas, o trabalho não foi concluído, mas também não falhou. Não há erros relatados. Nada no log do SQL e sp_who2não mostra nada bloqueando.

  • Aqui está um link para o plano estimado quando a consulta tiver um bom desempenho.
  • Aqui está um link para o plano estimado quando a consulta não for concluída.

O trabalho trunca uma tabela de preparo e insere cerca de 600.000 linhas de dados. O processo ETL tem acesso exclusivo à tabela. Quando verifiquei, tudo o que pude ver foi espera CXPACKET.

Eu rastreei a falha para um índice clusterizado exclusivo.

A tabela tem uma chave primária não clusterizada em uma coluna de identidade (veja abaixo)

CREATE TABLE [dbo].[Transform_JobCosting_Transaction](
    [ETL_TransformKey] [int] IDENTITY(1,1) NOT NULL,
    [TransactionId] [varchar](255) NOT NULL,
    [KeyType] [varchar](255) NOT NULL,
    [FinancialYear] [varchar](255) NOT NULL,
    [Job] [varchar](255) NOT NULL,
    [Subjob] [varchar](255) NOT NULL,
    [AnalysisCode] [varchar](255) NULL,
    [etc] [varchar](255) NOT NULL,
    [etc] [varchar](255) NOT NULL,
    [etc] [varchar](255) NOT NULL
     CONSTRAINT [PK_Transform_JobCosting_Transaction] PRIMARY KEY NONCLUSTERED 
(
    [ETL_TransformKey] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]

O índice clusterizado do problema é:

CREATE UNIQUE CLUSTERED INDEX [IDX_Unique] ON [dbo].[Transform_JobCosting_Transaction]
(   [FinancialYear] ASC,
    [KeyType] ASC,
    [TransactionId] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
GO

Há um terceiro índice não agrupado que não afeta a inserção.

Dois de nós estão trabalhando nisso há 4 horas. Eu deixei cair e re-adicionei o Índice 20-30 vezes tentando opções em diferentes combinações.

Resumo: O índice clusterizado bloqueia inserções. Não agrupado funciona bem.

Nós tentamos:

  • A reinicialização do servidor não fez diferença.
  • Tabelas truncadas e sp são executadas manualmente a partir do SSMS sem diferenças. (Com privs SA)
  • Reconstruir o índice não ajudou.
  • Se eu descartar o índice clusterizado, a inserção funciona.
  • Após inserir acima, posso adicionar o índice clusterizado sem erro.
  • Se descartar e adicionar novamente o índice como não agrupado, ele funcionará.
  • Eu verifiquei os dados e é único agrupado por esses 3 campos.
  • Alterar o índice para que não seja exclusivo não fez diferença.
  • Adicionar/remover with tablockdica não ajudou.
  • Tentei classificar os dados antes de inserir e não fez diferença.

Em execução: Microsoft SQL Server 2016 (SP1-CU2) (KB4013106) - 13.0.4422.0 (X64) Developer Edition (64 bits) no Windows Server 2012 R2 Standard 6.3

Quaisquer idéias ou sugestões seriam muito apreciadas.

sql-server sql-server-2016
  • 1 1 respostas
  • 6266 Views

1 respostas

  • Voted
  1. Best Answer
    Joe Obbish
    2017-08-01T12:08:22+08:002017-08-01T12:08:22+08:00

    Vamos dar um passo atrás e esquecer toda a solução de problemas em torno do índice clusterizado. Você tem uma INSERTconsulta que costumava terminar em um período de tempo razoável, mas agora não termina depois de horas. Por que essa consulta agora pode ser lenta? Vamos dar uma olhada no plano estimado:

    plano estimado ruim

    Lendo da direita para a esquerda, o plano é primeiro escanear a única linha de Extract_DW_Control_Finance, fazer um loop join com um scan of Extract_JCS_Transno lado interno, classificar os dados de acordo com a chave clusterizada da tabela de destino e fazer outro loop join com um digitalização do Extract_GL_Jnl_Translado interno. A primeira junção provavelmente não é o problema. O plano não pode realmente se beneficiar do paralelismo, mas com uma única linha no conjunto de resultados externo, a verificação Extract_JCS_Transdeve ocorrer apenas uma vez. No entanto, o otimizador estima que uma única linha sairá dessa junção. Se essa estimativa de linha estiver errada, você poderá acabar fazendo centenas de milhares de varreduras de índice clusterizado no Extract_GL_Jnl_Trans.

    O plano de consulta para a consulta com bom desempenho usa uma estratégia diferente. As estimativas de linha são significativamente diferentes e executa uma junção de hash:

    plano de consulta boa consulta

    Suspeito que o otimizador escolherá um plano diferente para a consulta com baixo desempenho se você corrigir as estimativas de linha. Se a Extract_DW_Control_Financetabela sempre tiver uma linha, considere movê-la para uma variável local e possivelmente usar uma RECOMPILEdica. Isso poderia resultar em uma estimativa muito melhor.

    Em termos de por que a remoção do índice clusterizado causa o problema, suspeito que o otimizador faça uma junção de hash Extract_GL_Jnl_Transsem o índice clusterizado. Uma junção de hash não preserva a ordem da entrada externa, mas uma junção de loop preserva a ordem. O otimizador pode ter custado fazer a classificação em uma única linha e executar uma junção de loop menor do que fazer uma junção de hash e executar a classificação posteriormente em 356.566 linhas. No entanto, se a classificação não for necessária, fazer a junção de hash pode ter um custo menor do que a junção de loop. Provavelmente tudo se resume a corrigir suas estimativas de cardinalidade.

    Se você precisar solucionar mais problemas enquanto a consulta lenta estiver em execução, considere o sinalizador de rastreamento 7412 se estiver no SQL Server 2016 SP1. Isso deve fornecer pistas sobre onde o SQL Server está "preso" no plano de consulta. Se você puder solicitar um plano real ou executar a consulta diretamente no SSMS, poderá usar sys.dm_exec_query_profiles ou o recurso de estatísticas de consulta ao vivo.

    • 8

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve