Quanto "Padding" coloco em meus índices?

Question

St.Antario

Asked: 2015-11-30 23:27:52 +0800 CST2015-11-30 23:27:52 +0800 CST 2015-11-30 23:27:52 +0800 CST

Como o parâmetro estatístico de correlação afeta o custo da varredura de índice?

772

Eu tenho a tabela customerstendo customerid SERIALcomo chave primária. Inicialmente, eu tinha a seguinte estatística para essa coluna:

  attname   n_distinct    correlation
customerid       -1         -0.393365

A seguinte consulta

EXPLAIN ANALYZE SELECT * FROM customers WHERE customerid < 10

produziu o seguinte plano analisado:

Index Scan using customers_pkey on customers  (cost=0.00..35.46 rows=9 width=268) (actual time=0.003..0.010 rows=9 loops=1)
  Index Cond: (customerid < 10)
Total runtime: 0.029 ms

Observe que o custo para obter todas as linhas é 35.46. Agora eu corri

CLUSTER customers USING customers_pkey;
ANALYZE;

e o correlationtornou-se igual a 1. Depois de executar a consulta mais uma vez, obtive o seguinte plano analisado:

Index Scan using customers_pkey on customers  (cost=0.00..8.41 rows=9 width=268) (actual time=0.003..0.005 rows=9 loops=1)
  Index Cond: (customerid < 10)
Total runtime: 0.024 ms

Observe que o custo diminuiu mais de 4 vezes ( 8.41agora). Minha pergunta é como exatamente o custo ranged index scandepende da correlação? Como é computado? Seria bom se você indicasse algumas referências à documentação do postgresql.

1 respostas

Voted

jjanes · Answer 1 · 2015-12-01T11:05:50+08:00

Best Answer

jjanes

2015-12-01T11:05:50+08:002015-12-01T11:05:50+08:00

Os detalhes que você deseja não serão encontrados na documentação, mas sim no código-fonte. Em particular, src/backend/optimizer/path/costsize.cna função cost_index.

Ele calcula min_IO_costcom base na suposição de que a tabela está correlacionada, max_IO_costcom base na suposição de que não está correlacionada e, em seguida, interpola entre elas com base na correlação.

2

Como o parâmetro estatístico de correlação afeta o custo da varredura de índice?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Como o parâmetro estatístico de correlação afeta o custo da varredura de índice?

1 respostas

relate perguntas