SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

John

Asked: 2014-04-24 12:59:21 +0800 CST2014-04-24 12:59:21 +0800 CST 2014-04-24 12:59:21 +0800 CST

Índice agrupado com processo ETL noturno

772

Temos um processo ETL noturno que envolve dados de várias fontes diferentes sendo nivelados e carregados em uma tabela completamente desnormalizada no SQL Server 2008 para geração de relatórios. O índice clusterizado na tabela consiste em uma chave composta de quatro colunas.

Devido à origem dos dados, não há realmente nenhuma maneira de carregar os dados na mesma ordem do índice clusterizado. Manter o índice ativo durante o carregamento ou descartá-lo/reconstruí-lo após o carregamento leva mais tempo do que o próprio carregamento sem um índice. Por outro lado, nenhum cluster com índices não clusterizados adequados ainda pode resultar em algumas consultas de relatórios que levam horas para serem processadas.

As únicas coisas em que consigo pensar para acelerar isso seriam particionar e colocar mais hardware no problema. Estou perdendo alguma coisa que ajudaria?

1 respostas

Voted

Thomas Kejser · Answer 1 · 2014-05-02T12:51:39+08:00

Existem algumas maneiras de contornar esse problema:

Como você mencionou, o particionamento ajudará. Se você particionar na coluna inicial do índice e garantir que todas as partições tenham o mesmo tamanho, poderá obter uma superescala. No entanto, o total de CPU necessário para criar o índice não será muito menor se você particionar. Mas economizará memória (se você tiver um sistema de E/S lento, isso pode ser útil)

Se esta for uma tabela de fatos de data warehouse tradicional, talvez seja melhor usar um índice columnstore

Em vez de fazer um mega update- que é lento. Considere este padrão:

Carregue as alterações que deseja fazer em uma tabela de preparação com o mesmo esquema e índice de cluster da tabela principal
Junte a tabela de preparação com a tabela antiga e use INSERT INTO em uma nova tabela com um índice de cluster. Habilitado sinalizador de rastreamento 610 ao fazer isso.

Desta forma, você pode manter o benefício da tabela antiga sendo ordenada e evitar reclassificar todas as linhas (somente as que foram alteradas).

Índice agrupado com processo ETL noturno

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Índice agrupado com processo ETL noturno

1 respostas

relate perguntas