Filtramos índices em nosso ambiente de produção. Enquanto fazia algumas pesquisas sobre eles, me deparei com este artigo " Índices filtrados e estatísticas filtradas podem ficar seriamente desatualizados "
É um índice filtrado bastante simples com base em um valor de código de 0
CREATE NONCLUSTERED INDEX
[IX_InsuranceOffer_FIX_OfferCode0]
ON [dbo].[InsuranceOffer]
(
[OfferId] ASC
)
WHERE ([OfferStatus]=(0))
WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF
, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF
, ONLINE = OFF, ALLOW_ROW_LOCKS = ON
, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 90) ON [PRIMARY]
distribuição parece
code codeCount code_distribution
------ ----------- -----------------
6 26186769 93.7526
0 1743401 6.2416
5 1107 0.0040
7 495 0.0018
Nossa intenção era modificar o índice existente para incluir o código 5. Com base neste artigo de ponto de inflexão , acredito que ambas as consultas devem continuar a usar o índice filtrado.
Tenho perguntas aos proprietários do sistema tentando entender a volatilidade dos códigos.
Até então, examinei sys.dm_db_index_physical_stats na tentativa de entender se nossa estratégia atual de reconstrução/reorganização de índice é suficiente para acompanhar o índice filtrado. Eu suspeito que não, mas meu fu interno é fraco.
index_level avg_fragmentation_in_percent fragment_count avg_fragment_size_in_pages page_count avg_page_space_used_in_percent record_count
----------- --------------------------------------- -------------------- -------------------------- -------------------- --------------------------------------- --------------------
0 0.6276 20 143.4 2868 90.0984 1743401
1 42.8571 7 1 7 86.0285 2868
2 0.0000 1 1 1 1.4455 7
sys.stats
para este índice mostra que foi atualizado pela última vez '2012-01-06 22:03:11.147'
Os dados acima são informações suficientes para basear uma decisão de reconstrução de índice ou eu precisaria ter métricas adicionais envolvidas? Ou, para índices filtrados, nos preocupamos com a fragmentação e devemos apenas atualizar explicitamente as estatísticas no intervalo X?
Eu reivindico a resposta "depende"
A única pergunta semi-relacionada era a contagem mínima de linhas para o índice filtrado?
Você tem duas perguntas aqui:
Um elo perdido é o tamanho do índice. Se você estiver falando sobre um objeto com menos de, digamos, 1.000 páginas, as reconstruções de índice não são tão críticas.
Outro elo perdido seria a rotatividade do índice. Normalmente vejo índices filtrados usados quando eles são um subconjunto muito, muito pequeno da tabela inteira, e o subconjunto muda rapidamente. Adivinhando pelo nome do seu campo de filtragem (OfferStatus = 0), parece que você está indexando apenas as linhas em que ainda não fez uma oferta e, em seguida, imediatamente fará uma oferta. Em situações como essa, os dados mudam tão rápido que as reconstruções do índice geralmente não fazem sentido.
O SQL Server atualiza estatísticas em objetos quando aproximadamente 20% dos dados são alterados, mas índices e estatísticas filtradas são um caso especial. Eles também são atualizados quando 20% dos dados são alterados - mas são 20% da tabela base, não 20% do subconjunto filtrado. Por causa disso, você provavelmente deseja atualizar manualmente as estatísticas periodicamente. Eu amo os scripts de manutenção de Ola Hallengren para isso - o procedimento armazenado de manutenção de índice tem um parâmetro para atualizar estatísticas e outro parâmetro para escolher o nível de amostragem que você deseja e outro parâmetro para escolher se deseja atualizar estatísticas em todos os objetos ou apenas aqueles com linhas alteradas. É fantástico.