Temos um ambiente de replicação de mesclagem que inclui
Publicador: Servidor1 onde apenas um banco de dados de 125 GB em replicação e também Distribuidor também é configurado no mesmo servidor hospedado em ambiente HyperV.
Assinantes: Temos aproximadamente 280 servidores com configuração de Distribuidor (assinatura push).
OBSERVAÇÃO: temos um ambiente com muitas alterações de DML no dia, portanto, realizamos muitas verificações diariamente em todos os servidores por meio de tarefas de manutenção e backup que incluem a etapa 1 : verificar a integridade do banco de dados completo etapa 2: Reconstruir/reorganizar o Ãndice etapa 3: Fazer backup/verificar step4: limpeza de trabalhos de backup antigos step5: limpeza do histórico de trabalhos antigos
Além disso, esse trabalho é concluÃdo em 4-5 horas diariamente, mas varia à s vezes de servidor para servidor.
O Snapshot Agent é executado diariamente às 00:05 AM
PROBLEMA:
Desde domingo à noite, estamos tendo esse problema em que o trabalho de backup e manutenção que está sendo executado até a manhã e a maioria dos trabalhos do servidor estão presos no step1 dbcc checkdb ('meu banco de dados') (e os clientes também estão reclamando que o aplicativo está travando, não pode login, muito lento)
Ao verificar, meu spid de backup está aguardando o tipo de espera OLEDB e não temos conexões de servidor vinculadas configuradas no Publisher e outros assinantes, exceto alguns que são nossos servidores da sede de onde fazemos nossas principais importações / pequenas atualizações / se precisarmos enviar todas as alterações do banco de dados.
Ao verificar a consulta abaixo, posso ver que a porcentagem está se movendo para o meu dbcc spid id, mas realmente não me diz por que está preso nesta etapa?
select session_id
, percent_complete
from sys.dm_exec_requests
where percent_complete > 0
E realmente não importa a que horas eu executo este trabalho ou uma única etapa, ou seja, dbcc checkdb, ele não foi concluÃdo.
Verifique também com nossa equipe do Windows se nenhuma atualização foi lançada no fim de semana e nenhuma alteração foi feita no lado do aplicativo.
Alguma sugestão do que pode ser o problema?
Fiquei sabendo que o antivÃrus foi atualizado na semana passada e no fim de semana passado todos os servidores foram reiniciados. Para testar em um servidor, desabilitamos alguns dos recursos de instalação de antivÃrus e meu trabalho foi executado com sucesso em um tempo razoável (4-5 horas). Espero que este trabalho globalmente também. Dedos cruzados!