AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 115366
Accepted
Jonesome Reinstate Monica
Jonesome Reinstate Monica
Asked: 2015-09-18 07:14:49 +0800 CST2015-09-18 07:14:49 +0800 CST 2015-09-18 07:14:49 +0800 CST

Grande atualização contínua em uma mesa enorme: ficando cada vez mais lento

  • 772

SQL Server 2014 Standard Edition

Temos uma tabela com mais de 100 milhões de linhas.

Precisamos atualizar os valores em algumas colunas.

Fizemos o abaixo, e ele está em execução há 18 horas e fez apenas 17 milhões de linhas. Está ficando cada vez mais lento.

É um servidor razoavelmente quente e sistema de disco (EMC RAID10 e tudo isso). O CREATE INDEX levou cerca de 20 minutos (uma interrupção infeliz que tivemos que tolerar).

Que abordagem podemos usar para passar por isso mais rápido? (on-line fortemente preferido)

CREATE NONCLUSTERED INDEX RECORD_DELETED_INDEX ON [dbo].[huge-table] ( [deleted] ASC, [deletedDate] ASC );
GO


DECLARE @CHUNK_SIZE int
SET @CHUNK_SIZE = 4000  -- to stay under lock escalation threshhold

UPDATE TOP(@CHUNK_SIZE) [huge-table] set deleted = 0, deletedDate = '2000-01-01'
where deleted is null or deletedDate is null

WHILE @@ROWCOUNT > 0
BEGIN
    UPDATE TOP(@CHUNK_SIZE) [huge-table] set deleted = 0, deletedDate = '2000-01-01'
    where deleted is null or deletedDate is null
END
sql-server transaction
  • 1 1 respostas
  • 95 Views

1 respostas

  • Voted
  1. Best Answer
    Solomon Rutzky
    2015-09-18T07:22:50+08:002015-09-18T07:22:50+08:00

    Provavelmente teria sido melhor criar o índice como filtro (ou seja, com uma cláusula WHERE), pois ele ficaria menor à medida que você atualizasse mais registros que seriam filtrados dele:

    CREATE NONCLUSTERED INDEX RECORD_DELETED_INDEX
      ON [dbo].[huge-table] ( [deleted] ASC, [deletedDate] ASC )
      WHERE deleted is null
      OR    deletedDate is null;
    

    No entanto, você ainda terá o problema de verificar esse índice toda vez que o loop for executado. Com 100 milhões de linhas na tabela e atualizando 4.000 por iteração, ou seja, 25.000 vezes você está verificando a tabela (ou índice) procurando linhas para atualizar. Seria melhor se você reduzisse o número de vezes que você consultou a tabela.

    Por favor, veja minha resposta a uma de suas outras perguntas sobre este projeto para uma configuração que deve tornar este processo muito mais rápido:

    servidor sql: atualizando campos em uma tabela enorme em pequenos pedaços: como obter progresso/status?

    Nessa resposta, mostro como consultar a tabela grande apenas 100 vezes. Cada vez que ele pega o(s) campo(s)-chave do índice agrupado e os usa para todas as UPDATEconsultas, para que as atualizações sejam rápidas. E essa configuração também permite obter o progresso atual da operação rapidamente (e sem ter que consultar a tabela!) e cancelar o processo de forma limpa.


    Deve-se notar que esta pergunta se refere às seguintes perguntas (listadas em ordem cronológica):

    • servidor sql: atualizando campos em uma tabela enorme em pequenos pedaços: como obter progresso/status? (observado acima)
    • As transações explícitas são necessárias neste loop while?
    • Sinalizador lock_escalation do SQL Server em ALTER TABLE - posso realmente reestruturar sem um bloqueio de tabela?
    • 4

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve