Estou usando VMs do Azure com um grupo de disponibilidade do SQL Server e scripts de Ola Hallengren. Os backups estão funcionando sem problemas, porém notei que os arquivos de backup antigos não estão sendo removidos do servidor.
Para remover os arquivos, estou executando este comando;
DECLARE @BackupDir NVARCHAR(4000) = (SELECT BackupDir = dbo.fn_SQLServerBackupDir())
DECLARE @Date DATETIME = DATEADD(DAY, -4, GETDATE())
EXECUTE [master].[dbo].xp_delete_file 0, @BackupDir, 'bak', @Date, 1;
Nota : A função obtém o local de backup padrão para a Instância SQL.
Sempre que executo este comando, ele é concluído com êxito, mas nenhum arquivo é removido. O processo de limpeza incluído no script Ola Hallengren também não consegue remover arquivos.
Em outros ambientes, que não são AGs, o comando acima, mais o script Cleanup in Ola Hallengren, funcionam sem problemas.
Isso me leva a pensar que o problema está relacionado ao ambiente ou tem algo a ver com o fato de os backups terem sido executados em bancos de dados em um AG.
Alguém já encontrou algo assim antes e pode ser capaz de oferecer algumas dicas?
Os backups são armazenados na unidade F:\, que é um disco local no servidor. Também confirmei que as permissões corretas foram definidas. No momento, defini o controle total para Todos. (O ambiente ainda não está ativo).
Tentei modificar a função para adicionar o \
no final do caminho de backup, mas isso não resolveu o problema. Confirmei que também existem backups que atendem ao requisito de data.
EDIT 1: Aqui está o comando de backup que está sendo executado, que inclui o parâmetro @Cleanup, que não remove os arquivos;
EXECUTE dbo.DatabaseBackup
@Databases = 'USER_DATABASES',
@BackupType = 'Log',
@Verify = 'Y',
@Checksum = 'Y',
@Compress = 'Y',
@LogToTable = 'Y',
@CleanupTime = 0,
@AvailabilityGroupDirectoryStructure = '{DatabaseName}',
@AvailabilityGroupFileName = '{DatabaseName}_{BackupType}_{Partial}_{CopyOnly}_{Year}_{Month}_{Day}_{Hour}{Minute}{Second}_{FileNumber}.{FileExtension}',
@Encrypt = 'Y',
@EncryptionAlgorithm = 'AES_256'
, @ServerCertificate = 'Cert_Name'
Como você mencionou que isso está em um AG, você tem certeza de que está executando o comando e verificando a pasta de backup no mesmo servidor?
Se você estiver se conectando ao grupo de disponibilidade primário por meio do ouvinte AG, a execução do
xp_delete_file
comando será executada em qualquer servidor físico que seja a réplica primária naquele momento.Tente executar
SELECT @@SERVERNAME
para verificar a qual servidor você está conectado ao executar o comando de exclusão de backup e, em seguida, verifique a unidade F:\ desse servidor para ver se os backups foram excluídos ou não.Você também deve verificar se está recebendo um
0
como o código de retorno do procedimento armazenado estendido:Observe que a chamada de exemplo
xp_delete_file
fornecida a você está direcionando arquivos com uma.bak
extensão. A chamada de exemplo para o script de backup do Ola tem como alvo os backups de log, que terão uma extensão de.trn
por padrão. Isso pode estar contribuindo para a discrepância que você está vendo.A propósito, eu recomendo fortemente que você faça backups em outro lugar que não seja a unidade local. Não apenas representa um único ponto de falha para sua instância do SQL Server e backups de banco de dados críticos, mas também pode ser bastante confuso com um AG ao fazer restaurações.
Em particular, se os backups do log de transações estiverem sendo levados para dois locais diferentes (pastas locais em cada réplica), a restauração para um ponto no tempo durante um período que inclui um failover de AG será difícil. Você terá que obter os arquivos de log de ambos os servidores e certificar-se de que eles sejam restaurados na ordem correta. O processo é muito mais simples se todos forem para um local de rede como
\\servername\backups\MyAgListenerName\DatabaseName\LOG
.Ok, agora consegui "resolver" esse problema.
Depois de não descobrir por que meus arquivos de backup não estavam sendo removidos, decidi testar esse cenário em minha réplica. Copiei um arquivo de backup para a réplica e executei o comando delete;
Funcionou! O processo de exclusão foi bem-sucedido e o arquivo de backup foi removido conforme o esperado.
Eu falhei no meu AG, executei alguns testes adicionais e consegui confirmar que todos os comandos de exclusão estavam funcionando conforme o esperado.
Pretendo adicionar um local de rede compartilhado para os arquivos de backup deste AG em seguida. Uma vez feito, tentarei executar esses comandos novamente no servidor (agora Réplica). Se eles ainda falharem, vou colocar a Réplica no lixo e construir uma nova para substituí-la.