AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 331534
Accepted
Segfault
Segfault
Asked: 2023-09-25 05:19:55 +0800 CST2023-09-25 05:19:55 +0800 CST 2023-09-25 05:19:55 +0800 CST

Como faço para consultar o maior valor usando um índice

  • 772

Eu tenho uma tabela com vários terabytes de dados de eventos em um esquema muito simples (id, bucket_id, data,created_at) e há um índice como este

create index index_events_on_created_at_and_bucket_id
    on public.events (created_at desc, bucket_id asc);

Agora pensei que seria rápido encontrar o ID do evento mais recente em cada bucket com uma consulta como:

select max(created_at), bucket_id from events group by bucket_id;

Explique a saída:

HashAggregate  (cost=170172168.62..170172178.41 rows=979 width=16)
  Group Key: bucket_id
  ->  Index Only Scan using index_events_on_created_at_and_bucket_id on events  (cost=0.70..156003994.34 rows=2833634856 width=16)

Parece estar usando o índice, mas fazendo uma varredura do índice em vez de apenas capturar o valor principal como eu esperava. De qualquer forma, ele não é concluído em tempo hábil. Suponho que seja um problema ao usar a função agregada na consulta, mas não sei como consertar.

Existe uma consulta que pode retornar o carimbo de data/hora mais recente (ou seja, o primeiro no índice) created_atde cada intervalo, obtendo-o desse índice?

postgresql
  • 1 1 respostas
  • 58 Views

1 respostas

  • Voted
  1. Best Answer
    Erwin Brandstetter
    2023-09-25T12:23:50+08:002023-09-25T12:23:50+08:00

    Melhor índice com liderançabucket_id

    Você quer uma linha por balde. Um índice com início bucket_id será muito mais útil.

    CREATE INDEX events_bucket_id_created_at_idx ON events (bucket_id, created_at DESC);
    

    Relacionado:

    • Um índice composto também é bom para consultas no primeiro campo?

    Como você tem um número muito pequeno de valores distintos em bucket_id( "rows=979" ), esta técnica de consulta deve fornecer resultados muito mais rápidos, com base no meu índice sugerido:

    WITH RECURSIVE cte AS (
       (  -- parentheses required
       SELECT bucket_id, created_at
       FROM   events
       ORDER  BY bucket_id, created_at DESC
       LIMIT 1
       )
       
       UNION ALL
       SELECT e.*
       FROM   cte c
       CROSS  JOIN LATERAL (
          SELECT e.bucket_id, e.created_at
          FROM   events e
          WHERE  e.bucket_id > c.bucket_id
          ORDER  BY e.bucket_id, e.created_at DESC
          LIMIT  1
          ) e
       WHERE  c.bucket_id IS NOT NULL
       )
    SELECT * FROM cte
    WHERE  bucket_id IS NOT NULL;
    

    Ele emula uma "varredura de índice solto", escolhendo apenas a "primeira" linha para cada distinto bucket_id- exatamente o que você está procurando.

    Observe como a ordem de classificação na consulta corresponde meticulosamente ao índice.

    Se o mapa de visibilidade da tabela estiver atualizado (ou seja, a tabela estiver limpa o suficiente), você obterá varreduras apenas de índice. Deve ser aplicado, já que a consulta lenta que você demonstrou também obteve uma verificação somente de índice. (Embora isso seja uma varredura de todo o índice, em vez de apenas as entradas principais por intervalo). Relacionado:

    • O PostgreSQL pode usar índices para agilizar consultas de contagem (distintas)?

    Isso pressupõe que ambas as colunas de interesse sejam NOT NULL. Caso contrário, você terá que fazer mais.

    Se você também tiver uma tabela bucketcom uma linha por relevante bucket_id, isso será ainda um pouco mais rápido:

    SELECT b.bucket_id, e.created_at
    FROM   bucket b
    CROSS  JOIN LATERAL (
       SELECT e.created_at
       FROM   events e
       WHERE  e.bucket_id = b.bucket_id
       ORDER  BY e.created_at DESC
       LIMIT  1
       ) e
    ORDER  BY b.bucket_id;
    

    Ver:

    • SELECT DISTINCT é mais lento que o esperado na minha tabela no PostgreSQL
    • Otimize a consulta GROUP BY para recuperar a linha mais recente por usuário

    Preso com índice ativado(created_at DESC, bucket_id ASC)

    Podemos trabalhar com as metainformações adicionais dos seus comentários:

    Eu sei que todos os grupos que me interessam têm eventos recentes

    Você pode aprimorar as consultas acima, mas um ângulo diferente com base nisso deve ter um desempenho melhor:

    SELECT DISTINCT ON (bucket_id)
           bucket_id, created_at
    FROM   events
    WHERE  created_at > now() - interval '15 minutes'  -- adapt as needed
    ORDER  BY bucket_id, created_at DESC;
    

    Deve ser mais rápido quando limitado à pequena (?) fração das linhas mais recentes. O Postgres pode ler as linhas superiores do índice e alimentá-las DISTINCT ON. Sobre DISTINCT ON:

    • Selecione a primeira linha em cada grupo GROUP BY?
    • 3

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve