Estive lendo uma postagem no blog de Paul Randal sobre o processo de backup do SQL Server, onde ele descreve as principais fases de um backup completo. Um ponto que ele menciona é que durante um backup completo, o processo lê "todas as extensões alocadas, independentemente de todas as 8 páginas da extensão estarem em uso".
Um backup completo tem as seguintes fases principais:
- Execute um ponto de verificação.
- Leia todos os dados em uso dos arquivos de dados (tecnicamente, lendo todas as extensões alocadas, independentemente de todas as 8 páginas da extensão estarem em uso).
- Leia todo o log de transações desde o início da transação não confirmada mais antiga, desde o ponto de verificação inicial até o momento em que a fase 2 terminou. Isso é necessário para que o banco de dados possa ser recuperado para um ponto consistente durante o processo de restauração (veja esta postagem para mais detalhes).
- (Opcionalmente, teste todas as somas de verificação da página, opcionalmente execute a compactação de backup e, opcionalmente, execute a criptografia de backup).
Essa afirmação me levou a pensar sobre os detalhes do que exatamente é feito o backup. Especificamente, o processo de backup inclui todas as extensões alocadas, mesmo que nem todas as páginas dentro dessas extensões estejam em uso?
Eu apreciaria quaisquer insights ou esclarecimentos sobre este tópico. Agradeço antecipadamente por sua ajuda!
Sim. As extensões são a unidade mais baixa de alocação de objetos (tecnicamente, desde 2016, todos os novos bancos de dados usam extensões uniformes, embora ao usar extensões compartilhadas haja páginas únicas alocadas) em geral para objetos de banco de dados. Independentemente disso, a unidade de alocação e, portanto, de backup em um arquivo de dados é a extensão.
Você mesmo pode fazer um teste sobre isso, se desejar, para verificar o comportamento.
Criei um banco de dados de teste sem nada realmente nele, criei uma tabela e coloquei uma única linha de pequena largura. Isso me dará uma extensão uniforme parcialmente preenchida (na verdade, uma única página, portanto, 1 página em uso e 7 páginas não em uso no momento e, portanto, reservadas).
Observe que a primeira página alocada para a tabela (NÃO a página IAM) está em 392, que é sempre o início de uma extensão. Fazendo as contas, a página 392 está na extensão 49 (392 páginas/8 páginas em uma extensão) e no disco no deslocamento (392 páginas * 8192 bytes por página) 3211264.
Se fizermos um backup, conforme observado em sua postagem original, primeiro ocorrerá um ponto de verificação para que todas as páginas sujas e quaisquer blocos de log necessários sejam descarregados no disco, porque o arquivo no disco é o que será lido para fazer o backup o banco de dados. Isso significa que deveríamos ter leituras nessa extensão e o tamanho da leitura deveria ser o tamanho da extensão (64k).
Você pode ver na imagem acima que é esse o caso. É feito backup de toda a extensão, independentemente de apenas uma única página ser "alocada". Para provar ainda mais esse ponto, o mesmo processo, exceto uma gravação, pode ser feito para uma restauração.
Você pode ver acima que a restauração gravou toda a extensão (64k) a partir do deslocamento da extensão no disco que calculamos. Assim, o nível em que isso é feito para objetos típicos em um banco de dados é no nível de extensão, ou 64k.
Observe que nem todos os IO serão de 64k e existem diferentes estruturas de controle que podem exigir comportamentos diferentes. Esta não foi a questão dos OPs, mas colocada aqui para os pedantes.
Observe também que Paulo responde isso em sua postagem original: