Primeiro, uma pequena descrição do sistema em que estou vendo o problema:
Minha empresa tem uma restauração agendada regularmente de um banco de dados de backups de outro, não vou entrar nos motivos comerciais para isso.
O banco de dados que está sendo restaurado está em uma instância do SQL Server 2014 com atualizações SP2-CU1 que está sendo executada em uma VM do Windows Server 2012 R2.
A unidade em que estão os arquivos mdf/ndf/ldf tem 1,19 TB de espaço livre e o banco de dados ocupa cerca de 863 GB. Os próprios arquivos .bak são mantidos. Há também alguns outros arquivos de banco de dados nesta unidade deixando 244 GB livres, o que suponho ser suficiente para fazer uma restauração sem nenhum problema relacionado a espaço de trabalho insuficiente.
No final de semana fazemos uma restauração de um backup completo, e em dias alternados é de um diferencial. Às vezes, vemos a restauração falhar várias vezes seguidas, no momento, tive cerca de 8 ou 9 tentativas consecutivas com falha desde segunda-feira. Isso geralmente ocorre ao restaurar do backup completo, o que me leva a acreditar que é um problema de desempenho do SQL Server ao lidar com grandes bancos de dados ou pode ser algo engraçado com as VMs?
O erro que estou vendo quando falha está abaixo. Isso pode ocorrer aparentemente em qualquer ponto durante a restauração, por exemplo, a última tentativa chegou a 76% de conclusão na restauração do backup completo antes de cair.
Msg 3203, Level 16, State 1, Line 2
Read on "\\VM\Backups\TheDatabase.bak" failed: 1130(Not enough server storage is available to process this command.)
Msg 3013, Level 16, State 1, Line 2
RESTORE DATABASE is terminating abnormally.
Msg 4319, Level 16, State 5, Line 3
A previous restore operation was interrupted and did not complete processing on file 'TheDatabase'. Either restore the backup set that was interrupted or restart the restore sequence.
Msg 3119, Level 16, State 1, Line 3
Problems were identified while planning for the RESTORE statement. Previous messages provide details.
Msg 3013, Level 16, State 1, Line 3
RESTORE DATABASE is terminating abnormally.
Existe um projeto para fazer particionamento, então precisamos apenas fazer backup e restaurar a parte quente do banco de dados, o que deve resolver isso, mas estou procurando por algo nesse ínterim que possa reduzir as ocorrências disso ou impedir que isso aconteça totalmente . Deixe-me saber se mais informações são necessárias para diagnosticar isso.
Qualquer ajuda seria muito apreciada!
A mensagem de erro está enganando você, não está falando sobre armazenamento em disco na máquina onde você está restaurando.
A mensagem de erro do Windows informa:
Ao verificar essa mensagem de erro, você notará que não é um erro durante a operação de restauração, mas sim durante a operação de cópia do arquivo pela rede, conforme documentado aqui
Ou aqui
Então, como você disse, você provavelmente tem armazenamento suficiente para restaurar o banco de dados, mas está tendo problemas para recuperar o arquivo pela rede. Em qualquer caso, você precisa estar olhando para algum problema SMB
Se você tivesse problemas de espaço em disco durante a restauração, a mensagem de erro seria:
Como @Nic apontou corretamente nos comentários, você provavelmente deve tentar copiar o arquivo de backup usando uma cópia de arquivo sem buffer (use ESEUTIL ou XCOPY) e restaurar a partir daí para resolver ou pelo menos isolar o problema.
Se você ainda tiver problemas ao copiar o arquivo dessa maneira, não tenho certeza se isso ainda se encaixa no escopo do dba.se.
Eu experimentei esse problema ontem. Deixe-me explicar meu cenário. Gostaria de restaurar mais de 10 dbs de uma máquina física SQL Server 2008R2 (Windows Server 2008R2) para outra máquina física 2016 (Windows Server 2012R2) para uma migração. Ponto importante: os arquivos de backup estavam na máquina de origem, restauração acionada a partir do compartilhamento criado no disco de backup de origem. (cenário dependente da rede) Para dbs pequenos (<500 GB), estava OK e a restauração foi bem-sucedida conforme o esperado. Mas quando se tratava de dbs de tamanho gigantesco (> 2 TB), as operações de restauração começaram a falhar inesperadamente e o mesmo erro apareceu. Esses resultados se repetiram para todas as minhas tentativas, a única diferença foi "nível de porcentagem completa" em que a operação de restauração falhou.
Alguém aqui também disse que a mensagem de erro era enganosa, é verdade. Isso faz você pensar que estava relacionado com o armazenamento, mas não está. O que eu fiz?
Percebi que a máquina de origem (backups localizados) estava ficando sem memória alocada para o sistema operacional em um ponto durante a restauração. Este ponto é onde a memória zero permaneceu para operações relacionadas ao sistema operacional e qualquer tentativa será interrompida drasticamente. Portanto, diminuí a memória alocada para o SQL Engine %20. (distribuição de memória antes da operação, %90 SQL- %10 SO ) Para que o SO tivesse a chance de alocar muito mais memória para tais operações. Desta vez, todas as tentativas foram bem-sucedidas para as que falharam antes.
Observação: assim que a migração foi concluída, devolvi a memória ao SQL Engine na máquina de origem.
Observação 2: Aumentar a capacidade de RAM da máquina de origem e adicionar novos slots seria outra opção, se aplicável. A limitação da memória pode não ser uma boa ideia para algumas instâncias. Pense duas vezes.
Quanto maior for o tamanho do seu backup, mais espaço de memória física será necessário para lidar com o gerenciador de cache de memória para suas operações dependentes de rede. Este é o meu aprendizado com a experiência. Você precisa monitorar a memória disponível alocada para o sistema operacional durante essas operações. Espero que ajude vocês!