Tenho várias tabelas com quantidade de linhas entre 5M e 1,5G
Cada tabela possui seu campo BLOB, cujo tamanho varia de 100 bytes a 30 MBytes e que é armazenado como 'tipos de valor grande fora da linha' = ON
As tabelas são armazenadas em grupos de arquivos diferentes com 3-4 arquivos cada um em discos diferentes em LUNs diferentes em SAN muito rápida
Todos os dias, essas tabelas crescem para 5-100 Gb de tamanho e com 600k - 1,5M de linhas
Após um certo período de tempo , que varia de 2 semanas a 6 meses, algumas das linhas são excluídas ou movidas para o banco de dados de arquivo, portanto, não há linhas nas tabelas de trabalho com mais de 6 meses.
Configuração atual do servidor:
- O mecanismo do servidor SQL é 2008 R2 SP1 Enterprise @ 24 núcleos, @ 64 Gb RAM
- O SQL Server é executado com sinalizadores de inicialização extras:
-T 3640; (Elimina o envio de mensagens DONE_IN_PROC para o cliente para cada instrução no procedimento armazenado. Isso é semelhante à configuração de sessão de SET NOCOUNT ON, mas quando definido como um sinalizador de rastreamento, cada sessão do cliente é tratada dessa maneira)
-T 1118;(Alterna as alocações no tempDB de 1pg por vez (para as primeiras 8 páginas) em uma extensão.)
-T 2301;(Permite otimizações avançadas que são específicas para consultas de suporte à decisão. Esta opção se aplica ao processamento de suporte à decisão de grandes conjuntos de dados)
-T 1117;(Cresce todos os arquivos de dados de uma vez, caso contrário, ele será alternado.)
-E; (Aumenta o número de extensões alocadas para cada arquivo em um grupo de arquivos. Essa opção pode ser útil para aplicativos de data warehouse que possuem um número limitado de usuários executando varreduras de índice ou dados)
-T 834; (Faz com que o SQL Server use alocações de página grande do Windows para a memória alocada para o buffer pool, http://msdn2.microsoft.com/en-us/library/aa366720.aspx , http://support.microsoft. com/kb/920093 )
- O SQL Server usa extensões de página grandes
- O SQL Server utiliza a opção de inicialização rápida de arquivo
- AUTOSHRINK está DESLIGADO para todos os bancos de dados
O problema é que, a partir de algum ponto do tempo de atividade do servidor (de alguns dias a meses) GHOST CLEANUP
, o processo se recusa a realizar limpezas forçadas e simplesmente faz seu trabalho normal - limpa várias páginas em vários segundos ( which is seen thru Extended Events
), o que não é adequado , porque não é capaz de limpar todas as linhas excluídas
O problema persiste desde os tempos do SQL Server 2005 RTM Enterprise
Como tentei resolver o problema:
- Tentou forçar operações SCAN em índices clusterizados das tabelas
- Tentou forçar operações SCAN, que envolvem todo o conteúdo da coluna BLOB em índices clusterizados das tabelas
- sistema sp_clean_db_free_space & sp_clean_db_file_free_space
- manualmente dbcc cleanpage(@dbid, @fileid, @page) para todos os arquivos e páginas no banco de dados
- reconstruções e reorganização de índice clusterizado
- recriando banco de dados
DBCC FORCEGHOSTCLEANUP
Quando executo a consulta:
select * from sys.dm_db_index_physical_stats(db_id(), object_id('ProblemTable'), 1, 0, 'detailed')
Vejo milhões e dezenas de milhões de registros fantasmas, mas apenas para o tipo de unidade de alocação de LOB_DATA
As únicas coisas que ajudam:
- parando o servidor com o comando SHUTDOWN ou reiniciando todo o host - ajuda, após reiniciar o processo GHOST CLEANUP é executado por algumas horas e realmente limpa todos os registros fantasmas
- DBCC SHRINKFILE com opção EMPTYFILE - mover todos os dados de um arquivo para outro ou arquivos recém-criados limpa registros fantasmas apenas neste arquivo - o problema é que eu realmente odeio operações de redução. E isso leva de 3 a 4 dias para UM arquivo
a pergunta - existe alguma maneira programática (preferível) ou de manutenção para forçar o GHOST CLEANUP sem tempo de inatividade do servidor, porque o tempo de inatividade do servidor custa muito, até mesmo inaceitável - é de milhares a dezenas de milhares de dólares por hora
Problemas foram notados como os meus estão aqui:
- http://support.microsoft.com/kb/932115
- http://www.sqlservercentral.com/Forums/Topic496244-149-1.aspx
E o mesmo está aqui:
Por fim, a MS reconheceu o problema como um bug: http://support.microsoft.com/kb/2622823
Resumidamente: é fixado em
No Sql Server 2012 SP1, não estou enfrentando o problema por mais de um ano de tempo de execução.
Esse é o tipo de pergunta que deve ser feita ao CSS para que ele possa resolver o problema com você. Você provavelmente tem garantia de software e um contrato de suporte. Se você não fizer algumas centenas de dólares, não deve ser um grande negócio se reiniciar a instância custar milhares de dólares por hora.
Você já tentou permitir que o banco de dados seja fechado e depois colocado online? Isso fará com que a recuperação de falhas seja executada e pode iniciar a limpeza fantasma.
Você está escrevendo para a mesa com frequência? Por frequentemente, quero dizer o tempo todo?
Quanto ao MSKB 932115, você está vendo os registros fantasmas sendo deixados apenas em todos os arquivos ou está limpando o primeiro arquivo no grupo de arquivos?
Por que usar -T1117 e init de arquivo instantâneo?