AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 115025
Accepted
Luan Huynh
Luan Huynh
Asked: 2015-09-15 19:50:29 +0800 CST2015-09-15 19:50:29 +0800 CST 2015-09-15 19:50:29 +0800 CST

Ajustando uma consulta com: índice, função de janela?

  • 772

Descrição

Ambiente: Centos 6-x64, Postgres Plus Advanced Server 9.3.
Tenho uma tabela com 4 colunas com dados conforme abaixo:

id    code_id            effective_date                 name
24      12       "2015-09-15 02:57:47.626751+00"      "dtsc_12"
429     215      "2015-09-15 02:57:47.626751+00"      "dtsc_215"
430     215      "2015-09-15 02:57:47.626751+00"      "dtsc_215"
465     233      "2015-09-15 02:57:47.626751+00"      "dtsc_233"
466     233      "2015-09-15 02:57:47.626751+00"      "dtsc_233"
468     234      "2015-09-15 02:57:47.626751+00"      "dtsc_234"

E eu quero obter todas as linhas com condição: group by code_ide max(effective_date) < current_timestamp. Então, o resultado que eu quero:

id     code_id             effective_date                name
24       12       "2015-09-15 02:57:47.626751+00"      "dtsc_12"
429      215      "2015-09-15 02:57:47.626751+00"      "dtsc_215"
465      233      "2015-09-15 02:57:47.626751+00"      "dtsc_233"
468      234      "2015-09-15 02:57:47.626751+00"      "dtsc_234"

minha codificação

create table win_a (
   id int not null primary key,
   code_id int,
   effective_date timestamp with time zone,
   name text
);

insert into win_a
select a,  a/2,  now() + trunc(random()  * 100) * '1 day'::interval, 'dtsc_' || (a/2)::int
from generate_series(1, 500) a
ORDER BY random() ;

create index win_a_indx on win_a using btree ( code_id, effective_date desc);

-- query 1
select a.*
from (
select id, code_id, effective_date, name
     , rank() over (partition by code_id order by effective_date desc, id) as rank
from win_a
where effective_date < current_timestamp
) a
where rank = 1 ;

-- query 2 -- false if in the same code_id -> have more than two same effective_date value
select a.*
from win_a a 
join (
    select code_id, max(effective_date) as max_ef
    from win_a 
    where effective_date < current_timestamp
    group by code_id ) b 
on a.code_id = b.code_id and a.effective_date = b.max_ef;

-- query 3 -- false if in the same code_id -> have more than two same effective_date value
select a.*
from win_a a 
where (code_id, effective_date) in
     (select code_id, max(effective_date) as max_ef
    from win_a 
    where effective_date < current_timestamp
    group by code_id );

Pergunta

  1. Posso usar o índice com a função de janela? (com a consulta 1, tento um índice, mas o Postgres ainda usa um seq-scan em vez de um index-scan)

  2. Como posso melhorar minha codificação?

postgresql optimization
  • 1 1 respostas
  • 443 Views

1 respostas

  • Voted
  1. Best Answer
    Erwin Brandstetter
    2015-09-16T05:13:43+08:002015-09-16T05:13:43+08:00

    Mais simples com DISTINCT ON- e também rápido para distribuição de dados com poucas linhas por code_id:

    • Selecione a primeira linha em cada grupo GROUP BY?

    SELECT DISTINCT ON (code_id) *
    FROM   win_a
    WHERE  effective_date < current_timestamp
    ORDER  BY code_id, effective_date DESC, id;
    

    E adicione uma NOT NULLrestrição à coluna effective_dateou você terá que fazer isso:

    ...
    ORDER  BY code_id, effective_date DESC NULLS LAST, id;
    

    E adapte o índice de acordo:

    CREATE INDEX win_a_idx on win_a (code_id, effective_date DESC NULLS LAST, id);
    

    Explicação:

    • Índice não utilizado na consulta de intervalo de datas

    Observe também que adicionei a idcoluna!
    No entanto, o Postgres pode não usar o índice. Para poucas linhas por code_id, e enquanto você seleciona todas elas, uma varredura sequencial pode ser mais rápida em qualquer caso.

    Para muitas linhas code_id, outras técnicas de consulta podem ser mais rápidas:

    • Otimize a consulta GROUP BY para recuperar o registro mais recente por usuário

    Para o seu caso - a menos que você tenha uma tabela separada contendo todos os possíveis code_id:

    WITH RECURSIVE cte AS (
       (  -- parentheses are required
       SELECT *
       FROM   win_a
       WHERE  effective_date < current_timestamp
       ORDER  BY code_id, effective_date DESC NULLS LAST, id
       LIMIT  1
       )
       UNION ALL
       SELECT w.*
       FROM   cte c
       ,      LATERAL (
          SELECT *
          FROM   win_a
          WHERE  code_id > c.code_id  -- lateral reference
          AND    effective_date < current_timestamp -- repeat condition
          ORDER  BY code_id, effective_date DESC NULLS LAST, id
          LIMIT  1
          ) w
       )
    SELECT *
    FROM   cte
    ORDER  BY code_id;
    

    Isso realmente vai usar o index.

    Quanto à sua pergunta 1: uma tabela de teste com apenas 500 linhas não é muito útil. Postgres usará uma varredura sequencial em qualquer caso. Um índice não será mais rápido para uma tabela pequena como essa.

    • 2

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve