Aumentar o valor default_statistics_target pode tornar seu banco de dados mais rápido, especialmente após a análise....
Lendo este artigo, vejo que https://discuss.pivotal.io/hc/en-us/articles/201581033-default-statistics-target-Explained
(...) em resumo e em termos básicos, este parâmetro controla a forma como as estatísticas são coletadas, sendo o valor 1 a estatística menos estimada/precisa e o valor 1000 a estatística mais precisa, obviamente com gasto de tempo/recursos ( CPU , memória etc ) / espaço . Normalmente, o valor padrão é suficiente para obter um plano preciso, mas se você tiver uma distribuição de dados complexa/ou uma coluna for referenciada na consulta com bastante frequência, definir um valor mais alto pode ajudar a obter estatísticas melhores na tabela e, portanto, uma melhor plano para o otimizador executar.
É uma boa explicação, mas, por exemplo, se eu definir default_statistics_target= 1000, o que 1000 realmente significa? São 1000 kilobytes de estatísticas sendo geradas? ou talvez sejam 1000 linhas das tabelas analisadas? Talvez seja 1000 colunas? ou talvez 1000 segundos para cada análise...
Então, minha pergunta é como esse número está realmente afetando a análise ou o planejador de consultas? Óbvio eu entendo que default_statistics_target = 1000 vai ter mais tempo que 100, para rodar analise, e que 1000 vai gerar estatísticas melhores...
Ele irá amostrar
300 * default_statistics_target
linhas de cada tabela. Ele usará essa amostra para determinar atédefault_statistics_target
os valores mais comuns a serem armazenados nessa matriz e atédefault_statistics_target
os limites do histograma a serem armazenados nessa matriz. Além de algumas outras estatísticas escalares, como o número de valores distintos.O multiplicador 300 foi escolhido porque alguma teoria estatística diz que é quantos você precisa amostrar por cada limite de histograma que deseja calcular, para que seus limites de histograma amostrados tenham um nível aceitável de incerteza.
A lista de valores mais comum é usada para ajudar o planejador a prever a seletividade de expressões de igualdade, como
where state='CA'
. Os limites do histograma são usados para ajudar o planejador a prever a seletividade da desigualdade ou expressões de intervalo, comowhere income between 55000 and 64000