Nas propriedades do banco de dados em Query Store, o "Intervalo de coleta de estatísticas" é definido como 1 hora. Isso também é confirmado consultando a visualização query_store_runtime_stats_interval
- todos os intervalos abrangem exatamente 1 hora. No entanto, ao visualizar relatórios como “Consumo geral de recursos”, é possível selecionar “Minuto” no menu suspenso “Tamanho da agregação” e mostra dados que parecem plausíveis.
Consegui capturar uma consulta usada no "Relatório de principais consultas que consomem recursos" e parece que ele exibe todos os planos, que também foram executados no intervalo selecionado de 1 minuto, mas as estatísticas ainda parecem se referir ao intervalo completo de coleta. Portanto, meu palpite seria não confiar em nada para intervalos menores que o intervalo de coleta. Estou correto ou os relatórios mostram dados confiáveis?
SELECT TOP (@results_row_count)
p.query_id query_id
, q.object_id object_id
, ISNULL(OBJECT_NAME(q.object_id),'') object_name
, qt.query_sql_text query_sql_text
, ROUND(CONVERT(float, SUM(rs.avg_duration*rs.count_executions))*0.001,2) total_duration
, SUM(rs.count_executions) count_executions
, COUNT(distinct p.plan_id) num_plans
FROM sys.query_store_runtime_stats rs
JOIN sys.query_store_plan p ON p.plan_id = rs.plan_id
JOIN sys.query_store_query q ON q.query_id = p.query_id
JOIN sys.query_store_query_text qt ON q.query_text_id = qt.query_text_id
WHERE NOT (rs.first_execution_time > @interval_end_time OR rs.last_execution_time < @interval_start_time)
GROUP BY p.query_id, qt.query_sql_text, q.object_id
HAVING COUNT(distinct p.plan_id) >= 1
ORDER BY total_duration DESC
Você pode ver na consulta que o que eles estão fazendo é capturar o material dentro do intervalo que possui uma data e hora para a primeira ou última execução que se enquadra no intervalo de tempo mais restrito do relatório. Portanto, conterá alguns dados muito precisos. No entanto, se alguma consulta foi executada dentro desse período, mas o primeiro e o último tempo de execução estão fora do intervalo de seu interesse, você não a verá. Os dados armazenados no Query Store são apenas agregados, agregados pelo intervalo de coleta. Não existe uma segunda camada mais profunda de dados ou algo parecido.
Obrigado @Grant por confirmar que o intervalo de coleta realmente define a granularidade dos dados. Analisei um pouco mais as dúvidas e gostaria de expandir um pouco a parte sobre precisão.
Pelo que entendi a consulta (*), os intervalos de execução e relatório só precisam se sobrepor para que o plano seja listado no "Relatório de principais consultas que consomem recursos". A precisão dos dados depende, portanto, muito da frequência com que o plano é executado. Em um banco de dados de aplicativos ocupado, as mesmas consultas serão usadas repetidamente, basicamente definindo o primeiro e o último tempo de execução iguais ao intervalo de coleta. Supondo que o número de execuções esteja distribuído uniformemente, os dados mostrados no relatório estarão errados por um fator de 60.
Ainda mais surpreendentes são os dados do “Relatório Geral de Consumo de Recursos”:
Eu surtei na primeira vez que vi esses gráficos. O que poderia causar esses picos no meu banco de dados ao final de cada hora? Felizmente, a verdade é: os picos não são reais.
A consulta para o relatório foi postada aqui , onde a parte crucial é:
O intervalo é determinado pelo último tempo de execução, que será igual ao final do intervalo de coleta para muitas consultas, como observei antes.
Conclusão : esta é uma pequena história de advertência sobre como tentar relatar informações que não existem, produzirá resultados falsos. A Microsoft não avisa que você está prestes a ver uma bobagem. Também não consegui encontrar nada na internet sobre esse assunto. Portanto, para qualquer pessoa que analisou os relatórios e encontrou números engraçados, relaxe. Verifique o intervalo de coleta, não ultrapasse.
(*) NOT(x OR y) é verdadeiro, quando x e y são falsos, onde
x = rs.first_execution_time > @interval_end_time e
y = rs.last_execution_time <@interval_start_time
o que significa que o plano deve ser executado primeiro antes do horário de término do relatório e vice-versa.