Eu tenho uma única tabela que contém 4 bilhões de linhas que pretendo dividir em tabelas separadas para cada trimestre do ano. Em seguida, desejo criar uma exibição particionada em todas as tabelas.
No momento, tenho um grupo de arquivos para dados (onde reside a maioria dos dados) e um grupo de arquivos para índices não agrupados (tenho migrado lentamente os índices para este grupo de arquivos)
O grupo de arquivos de dados e o grupo de arquivos de índices não agrupados estão localizados em discos diferentes.
As tabelas individuais terão chaves primárias e índices não clusterizados adicionados a elas. Onde devo colocar isso? (Em termos de grupos de arquivos) Devo criar grupos de arquivos para cada tabela, para cada tipo de índice etc?
Observação: não posso usar o particionamento de dados porque não temos a edição Enterprise.
Se você estiver usando exibições particionadas tradicionais com cada tabela contendo um trimestre anual diferente, terá alguns níveis de separação aqui:
Em outras palavras, digamos que você tenha 10 tabelas acessadas pela exibição particionada e um índice clusterizado e um índice não clusterizado em cada tabela. Neste caso, você está olhando para 20 estruturas de dados diferentes que você precisa colocar de acordo.
Onde colocar cada um deles dependerá em grande parte da sua carga de trabalho. Por exemplo, se apenas as duas tabelas trimestrais mais recentes obtiverem o maior número de consultas de relatório e modificação de dados, você deverá garantir que elas sejam separadas. Mas, da mesma forma, você pode se beneficiar do fato de cada uma dessas tabelas ter seus índices em discos separados.
Digo discos aqui porque grupos de arquivos são agrupamentos lógicos de arquivos de dados de banco de dados. Mesmo se você dividir cada tabela e cada índice em seu próprio grupo de arquivos (exagerado para ilustrar um ponto), mas todos os arquivos de dados contidos estiverem no mesmo conjunto de discos físicos, você realmente não verá nenhum ganho de desempenho de E/S subjacente. É realmente apenas administrativo nesse ponto. Você nem sempre pode dividir a camada física e a camada lógica ao espremer o desempenho de um projeto.
Portanto, você precisa definir visualmente a separação do disco físico, que tipo de carga de trabalho comum receberá e projetar o posicionamento dos dados dessa maneira.
Vejo vários pontos a serem abordados aqui:
Começando com o segundo, separar índices não agrupados pode não ser uma boa ideia como uma abordagem de propósito geral.
Ter o armazenamento alinhado (linhas em uma tabela, juntamente com os índices dependentes dessas linhas armazenadas no mesmo grupo de arquivos) garante que, se você deseja fazer backup ou restaurar uma partição, os dados e os índices correspondentes sejam mantidos juntos.
Fora isso, se você quiser ter uma tabela com dados antigos e outra só com os mais recentes, você vai querer trabalhar com SWITCH, que tem entre outros os seguintes requisitos: