AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 345171
Accepted
dennis
dennis
Asked: 2025-02-08 22:35:43 +0800 CST2025-02-08 22:35:43 +0800 CST 2025-02-08 22:35:43 +0800 CST

Recuperando espaço após remover colunas varbinary

  • 772

Tenho uma tabela de quase um milhão de linhas com duas colunas de datatype varbinary. Essas duas colunas armazenam dados binários que fazem o banco de dados crescer para 1 TB.

Como esse banco de dados também é restaurado em outros ambientes de controle de qualidade e em um ambiente de desenvolvimento, agora temos a tarefa de recuperar o máximo de espaço possível para economizar custos.

Após envolver o fornecedor, eles informaram que essas duas colunas podem ser descartadas, pois não estão mais em uso. A escrita do aplicativo para essas duas colunas foi modificada de acordo.

Eu segui duas opções para abordar a situação no meu ambiente de desenvolvimento, mas preciso de ajuda sobre a abordagem correta.

Opção 1

  1. Solte as duas colunas binárias
  2. Executar DBCC CLEANTABLE- Esta etapa levou quase 24 horas. Tive que pará-la porque não terei tanto tempo no ambiente de produção.
  3. Encolher o sistema de arquivos - Estou um pouco relutante em fazer isso por causa da fragmentação.

Fiquei preso no número 2 acima e então tentei a segunda opção abaixo.

Opção 2

  1. Solte as duas colunas binárias
  2. Crie uma nova tabela e copie os dados usando o SSIS - Esta operação levou quase 12 horas para ser concluída (não terei tanto tempo em produção)
  3. Crie um sistema de arquivos diferente e mova todas as tabelas e outros objetos para este novo sistema de arquivos de tabela, exceto a tabela antiga em questão, usando o CREATE INDEX…WITH DROP_EXISTING = ON, ONLINE = ONcomando
  4. Solte a tabela antiga no sistema de arquivos primário
  5. Encolher o sistema de arquivos primário - Espero que isso encolha mais rápido, pois não há muitos objetos nele.

O item 2 levou quase 12 horas para ser concluído. Alguém conhece uma abordagem melhor para se livrar dessas duas colunas e recuperar o espaço?

O ambiente de produção tem AOAG (Always On), o que significa que preciso estar em recuperação total.

O uso DBCC CLEANTABLEdemorou muito e meu log estava crescendo. Tive que parar para tentar a opção 2. Depois de correr por mais de 24 horas, parei. Demorou muito para finalmente parar. Foi nesse ponto que pensei que DBCC CLEANTABLEnão era uma boa opção para mim.

sql-server
  • 2 2 respostas
  • 95 Views

2 respostas

  • Voted
  1. Best Answer
    Comment Answers
    2025-02-09T13:41:32+08:002025-02-09T13:41:32+08:00

    copie os dados usando o SSIS

    Por que SSIS? Você poderia simplesmente usar um INSERT...SELECTe adicionar TABLOCKXdicas.

    Além disso, DBCC CLEANTABLEvocê pode definir um tamanho de lote (padrão 1000 linhas) para que você possa executá-lo durante o horário de trabalho. – Charlieface

    Se um tamanho de lote for especificado, o comando será executado em uma série de transações, cada uma incluindo o número especificado de linhas.

    Isso significa que você pode pará-lo a qualquer momento e o trabalho que ele comprometeu será preservado. Ele continuará de onde parou na próxima vez que você executá-lo.

    Com 1 TB de dados em menos de um milhão de linhas, o tamanho médio das linhas deve ser superior a 1 MB, o que significa que há muitas colunas, grandes colunas LOB ou ambos.

    Nesse caso, especificar um tamanho de lote menor do DBCC CLEANTABLEque o padrão pode ser importante. Rollbacks com colunas LOB grandes podem ser muito lentos. Reduzir o tamanho do lote pode ajudar com isso.

    O quanto menor você torna o tamanho do lote depende de quão lenta foi a recuperação da interrupção do padrão. Faça seu melhor palpite e experimente. Não há informações na pergunta para especular.

    DBCC CLEANTABLEnão libera espaço liberado. As páginas liberadas geralmente estarão espalhadas por todo lugar. Você precisa de uma operação de redução para consolidar o espaço livre no final do(s) arquivo(s) para que eles possam ser truncados.

    DBCC CLEANTABLEnão deve falhar devido à atividade simultânea, mas também não ajudará. Pode causar bloqueio temporário. Idealmente, você não teria nenhuma atividade simultânea. Usar recuperação simples não aceleraria DBCC CLEANTABLE.

    Ou tente os métodos SELECT INTOor INSERT...SELECTem vez disso, embora reescrever 1 TB de dados provavelmente também não seja rápido. Depende de quantos dados restam depois que as duas colunas são descartadas, o que a pergunta não especifica. Se você puder alterar o modelo de recuperação, isso pode ajudar, dependendo do seu hardware.

    Use os DBCC SHRINKcomandos para recuperar espaço após concluir DBCC CLEANTABLEou criar a nova tabela e remover a antiga. Pode demorar um pouco, mas também é possível retomar. Mover os dados novamente para um novo grupo de arquivos parece contraproducente.

    Algumas operações grandes simplesmente não podem ser concluídas em uma única janela, dadas as restrições ambientais. Com planejamento correto, você pode concluir o trabalho ao longo de um período de tempo. O mesmo com a recuperação de espaço.

    • 1
  2. Edward Dortland
    2025-02-09T16:35:16+08:002025-02-09T16:35:16+08:00
    1. Certifique-se de que seu modelo de recuperação esteja em registro simples ou em massa.
    2. Crie a tabela de destino sem nenhum índice
    3. Execute uma inserção em new_table com (tablock) select cola,colb,colc from old_table

    Como você está usando o modelo de recuperação simples ou em massa e está usando uma dica de bloqueio de tabela, provavelmente agora está usando operações em massa minimamente registradas e também pode obter uma inserção paralela .

    Em vez de ter que registrar cada registro no log de transações, agora você está registrando apenas informações de alocação (e imagens de página inteira na confirmação), o que acelera muito a cópia.


    Se você não puder usar o registro mínimo, ainda poderá obter dados paralelos sendo carregados INSERT...SELECTem um heap (tabela sem índices, nem mesmo um índice clusterizado) ou SELECT INTO.

    • 1

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve