Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

Question

Mikko Ohtamaa

Asked: 2022-05-30 09:40:27 +0800 CST2022-05-30 09:40:27 +0800 CST 2022-05-30 09:40:27 +0800 CST

Indexando apenas o primeiro e o último item de uma série

772

O PostgreSQL suporta algum tipo de índice esparso que seria útil para indexar apenas o primeiro e o último valor da tabela, com base em uma determinada chave?

Considere os seguintes dados:

CREATE TABLE samples (
   device_id int not null;
   ts timestamp not null;
   value real not null;
);

Agora, vamos supor que eu tenha milhões de dispositivos e cada um possa ter bilhões de amostras. Eu quero acessar todos esses dados - se o acesso for lento, não me importo. No entanto, estou especialmente interessado em acessar o primeiro e o último valor por tstimestamp: (device_id, value) muito, rápido. Isso para saber qual é o intervalo de amostras para um dispositivo específico.

Eu posso construir uma lógica de gatilho/aplicativo que gerencie uma tabela separada onde as informações são armazenadas:

CREATE TABLE first_last_samples (
   device_id int not null;
   first_ts timestamp not null;
   first_value real not null;
   last_ts timestamp not null;
   last_value real not null;
);

No entanto, gerenciar a lógica para armazenar em cache o primeiro/último item parece um pouco desajeitado. Estou perguntando se o PostgreSQL gerenciaria algum tipo de índice especial, talvez por extensões, o que me permitiria resolver esse problema no nível de definição de tabela/exibição/índice?

Como existem bilhões de pontos de dados, colocar todos eles no índice não parece fazer sentido se você estiver interessado apenas no primeiro e no último.

1 respostas

Voted

Erwin Brandstetter · Answer 1 · 2022-06-04T07:58:07+08:00

Best Answer

Erwin Brandstetter

2022-06-04T07:58:07+08:002022-06-04T07:58:07+08:00

Se seus padrões de acesso não divulgados e/ou outras restrições não permitirem a MATERIALIZED VIEWou uma solução de gatilho manter uma tabela com min/max per device_idatualizada, a ferramenta padrão mais próxima pode ser um índice BRIN , que é muito menor que um correspondente Índice de árvore B, normalmente por várias ordens de magnitude. Mas sua eficiência também depende da distribuição de dados não divulgados em sua tabela. Ver:

Testando a eficiência de um índice BRIN no Postgres

1

Indexando apenas o primeiro e o último item de uma série

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Indexando apenas o primeiro e o último item de uma série

1 respostas

relate perguntas