Quanto "Padding" coloco em meus índices?

Question

Leon

Asked: 2021-04-26 06:37:29 +0800 CST2021-04-26 06:37:29 +0800 CST 2021-04-26 06:37:29 +0800 CST

É necessário reinserir todos os dados em ordem específica, quando vou usar o índice BRIN?

772

Vou usar um índice BRIN para substituir o índice B-tree em uma coluna de data/hora no Postgresql-11. Eu nunca usei antes.

Já que um índice BRIN pode ser mais eficaz se os dados forem armazenados fisicamente na ordem em que a coluna está sendo indexada.

Estou em dúvida se devo ou não excluir todos os dados, e depois reinseri-los no pedido. Meus dados estão sendo usados para análise estática, não mudariam.

1 respostas

Voted

matigo · Answer 1 · 2021-04-26T07:19:51+08:00

Como tudo relacionado a bancos de dados, a resposta será “depende”.

Os índices BRIN são eficientes se a ordenação dos valores-chave seguir a organização dos blocos na camada de armazenamento. No caso mais simples, isso pode exigir a ordenação física da tabela, que geralmente é a ordem de criação das linhas dentro dela, para corresponder à ordem das chaves. Chaves em números de sequência gerados ou dados criados são os melhores candidatos para um índice BRIN.

Você mencionou que o índice será feito em uma coluna de data/hora, portanto, desde que esses registros já estejam armazenados sequencialmente na tabela, você não precisará fazer um dump e recarregar. Se os valores estiverem em todos os lugares, seria de seu interesse exportar os dados na nova ordem, descartar a tabela e recarregar.

Os índices BRIN usam muito menos armazenamento em comparação com um índice B-Tree normal, mas podem ser bastante “com perdas”, o que reduzirá sua eficácia. Você pode ajustar isso especificando um pages_per_rangevalor como este:

CREATE INDEX idx_date_brin ON my_stats_db USING BRIN(transaction_date) WITH (pages_per_range = 32);

Os índices BRIN armazenam entradas para um intervalo de páginas em uma tabela correspondente. Quanto maior o intervalo de páginas, menor o índice. Quanto menor o índice, mais perdedor ele se torna.

Como os índices podem ser criados e destruídos muito mais rapidamente do que um carregamento de tabela completo (névoa do tempo), sugiro brincar em um sistema de não produção para ver se um BRIN é melhor que uma árvore B para seu caso de uso e se os dados da sua tabela forem sequenciais o suficiente para não exigir um recarregamento.

Espero ter ajudado ??

É necessário reinserir todos os dados em ordem específica, quando vou usar o índice BRIN?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

É necessário reinserir todos os dados em ordem específica, quando vou usar o índice BRIN?

1 respostas

relate perguntas