SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

Julian

Asked: 2012-05-24 03:51:25 +0800 CST2012-05-24 03:51:25 +0800 CST 2012-05-24 03:51:25 +0800 CST

Restaurar banco de dados excluindo dados FILESTREAM

772

Contexto
Estamos desenvolvendo um sistema com um banco de dados grande na parte inferior. É um banco de dados MS SQL executado no SQL Server 2008 R2. O tamanho total do banco de dados é de cerca de 12 GB.

Destes, aproximadamente 8,5 GB estão em uma única tabela BinaryContent. Como o nome sugere, trata-se de uma tabela onde armazenamos arquivos simples, de qualquer tipo, diretamente na tabela como um BLOB. Recentemente, testamos a possibilidade de mover todos esses arquivos do banco de dados para o sistema de arquivos usando o FILESTREAM.

Fizemos as modificações necessárias em nosso banco de dados sem problemas, e nosso sistema continua funcionando bem após a migração. A BinaryContenttabela fica mais ou menos assim:

CREATE TABLE [dbo].[BinaryContent](
    [BinaryContentID] [int] IDENTITY(1,1) NOT NULL,
    [FileName] [varchar](50) NOT NULL,
    [BinaryContentRowGUID] [uniqueidentifier] ROWGUIDCOL  NOT NULL
) ON [PRIMARY] FILESTREAM_ON [FileStreamContentFG]
ALTER TABLE [dbo].[BinaryContent] ADD [FileContentBinary] [varbinary](max) FILESTREAM  NULL
ALTER TABLE [dbo].[BinaryContent] ADD  CONSTRAINT [DFBinaryContentRowGUID]  DEFAULT (newsequentialid()) FOR [BinaryContentRowGUID]

Com tudo residindo no PRIMARYgrupo de arquivos, exceto o campo FileBinaryContentque está em um grupo de arquivos separado FileStreamContentFG.

Cenário
Do ponto de vista de um desenvolvedor, geralmente gostaríamos de uma nova cópia do banco de dados de nosso ambiente de produção, para podermos trabalhar com os dados mais recentes. Nesses casos, raramente estamos interessados nos arquivos armazenados em BinaryContent (agora usando FILESTREAM).

Temos isso quase funcionando como gostaríamos. Fazemos backup do banco de dados, sem o fluxo de arquivo assim:

BACKUP DATABASE FileStreamDB
FILEGROUP = 'PRIMARY' 
TO DISK = 'c:\backup\FileStreamDB_WithoutFS.bak' WITH INIT

E restaure-o assim:

RESTORE DATABASE FileStreamDB
FROM DISK = 'c:\backup\FileStreamDB_WithoutFS.bak'

Isso parece estar funcionando bem, e nosso sistema funciona desde que evitemos as partes que usam o FileBinaryContentcampo. Podemos, por exemplo, executar a seguinte consulta sem problemas:

SELECT TOP 10 [BinaryContentID],[FileName],[BinaryContentRowGUID]
--,[FileContentBinary]
FROM [dbo].[BinaryContent]

Naturalmente, se eu descomentar a linha acima, inclusive FileContentBinaryna consulta, recebo um erro:

Dados de objetos grandes (LOB) para a tabela "dbo.BinaryContent" residem em um grupo de arquivos offline ("FileStreamContentFG") que não pode ser acessado.

Nosso sistema lida com arquivos em que o conteúdo é definido como null, então o que eu gostaria de fazer é algo assim:

UPDATE [dbo].[BinaryContent]
SET [FileContentBinary] = null

Mas é claro que isso me dá o mesmo erro acima. Neste ponto estou preso.

Pergunta
Existe alguma maneira de restaurar o banco de dados sem precisar restaurar também tudo do FileStreamContentFGgrupo de arquivos? Atualizando os valores para nulo como estou tentando acima, ou padrão para nulo quando o arquivo está ausente ou algo assim?

Ou talvez eu esteja abordando o problema da maneira errada?

Sou um desenvolvedor por natureza e não tenho muito conhecimento como DBA, então me desculpe se estou deixando passar alguma coisa trivial aqui.

2 respostas

Voted

Mark Storey-Smith · Answer 1 · 2012-05-27T05:52:29+08:00

O que você está tentando fazer deixaria o banco de dados em um estado inconsistente (transacionalmente), portanto, não é possível.

O white paper Partial Database Availability é um guia de referência útil e inclui um exemplo de como verificar se uma determinada tabela ou arquivo está online. Se o seu acesso aos dados fosse por meio de procedimentos armazenados, você poderia incorporar essa verificação com relativa facilidade.

Uma abordagem alternativa (mas um tanto hacky) que pode valer a pena dar uma olhada em seu cenário seria ocultar a tabela e substituí-la por uma visualização.

-- NB: SQLCMD script
:ON ERROR EXIT
:setvar DatabaseName "TestRename"
:setvar FilePath "D:\MSSQL\I3\Data\"

SET STATISTICS TIME OFF;
SET STATISTICS IO OFF;
SET NOCOUNT ON;
GO

USE master;
GO

IF EXISTS (SELECT name FROM sys.databases WHERE name = N'$(DatabaseName)')
  DROP DATABASE $(DatabaseName)
GO

CREATE DATABASE $(DatabaseName) 
ON PRIMARY 
  (
  NAME = N' $(DatabaseName)'
  , FILENAME = N'$(FilePath)$(DatabaseName).mdf'
  , SIZE = 5MB
  , MAXSIZE = UNLIMITED
  , FILEGROWTH = 1MB
  ) 
, FILEGROUP [FG1] DEFAULT
  ( 
  NAME = N' $(DatabaseName)_FG1_File1'
  , FILENAME = N'$(FilePath)$(DatabaseName)_FG1_File1.ndf'
  , SIZE = 1MB
  , MAXSIZE = UNLIMITED
  , FILEGROWTH = 1MB 
  ) 
, FILEGROUP [FG2] CONTAINS FILESTREAM
  ( 
  NAME = N'$(DatabaseName)_FG2'
  , FILENAME = N'$(FilePath)Filestream'
  )
LOG ON 
  ( 
  NAME = N'$(DatabaseName)_log'
  , FILENAME = N'$(FilePath)$(DatabaseName)_log.ldf'
  , SIZE = 1MB
  , MAXSIZE = UNLIMITED
  , FILEGROWTH = 1MB
  )
GO

USE $(DatabaseName);
GO

CREATE TABLE [dbo].[BinaryContent](
    [BinaryContentID] [int] IDENTITY(1,1) NOT NULL
    , [FileName] [varchar](50) NOT NULL
    , [BinaryContentRowGUID] [uniqueidentifier] ROWGUIDCOL UNIQUE DEFAULT (NEWSEQUENTIALID()) NOT NULL
  , [FileContentBinary] VARBINARY(max) FILESTREAM  NULL
) ON [PRIMARY] FILESTREAM_ON [FG2]
GO 

-- Insert test rows
INSERT
  dbo.BinaryContent
  (
  [FileName]
  , [FileContentBinary]
  )
VALUES
  (
  CAST(NEWID() AS VARCHAR(36))
  , CAST(REPLICATE(NEWID(), 100) AS VARBINARY)
  );
GO 100

USE master;
GO

-- Take FILESTREAM filegroup offline
ALTER DATABASE $(DatabaseName)
MODIFY FILE (NAME = '$(DatabaseName)_FG2', OFFLINE)
GO

USE $(DatabaseName);
GO

-- Rename table to make way for view
EXEC sp_rename 'dbo.BinaryContent', 'BinaryContentTable', 'OBJECT';
GO

-- Create view to return content from table but with NULL FileContentBinary
CREATE VIEW dbo.BinaryContent
AS

SELECT
  [BinaryContentID]
    , [FileName] 
    , [BinaryContentRowGUID]
  , [FileContentBinary] = NULL
FROM
  [dbo].[BinaryContentTable];
GO

-- Check results as expected
SELECT TOP 10
  *
FROM
  dbo.BinaryContent;
GO

Bob · Answer 2 · 2012-09-12T03:43:57+08:00

Bob

2012-09-12T03:43:57+08:002012-09-12T03:43:57+08:00

Você pode isolar a tabela com um FILESTREAMem um banco de dados separado e criar uma referência a ela no banco de PRODUCTIONdados usando uma exibição.

Isso permitiria que você fizesse o que quisesse sem recorrer a hacks.

5

Restaurar banco de dados excluindo dados FILESTREAM

Como ver a lista de bancos de dados no Oracle?

Quão grande deve ser o mysql innodb_buffer_pool_size?

Listar todas as colunas de uma tabela especificada

restaurar a tabela do arquivo .frm e .ibd?

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Como selecionar a primeira linha de cada grupo?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Restaurar banco de dados excluindo dados FILESTREAM

2 respostas

relate perguntas