AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 339197
Accepted
hunter
hunter
Asked: 2024-05-03 02:52:14 +0800 CST2024-05-03 02:52:14 +0800 CST 2024-05-03 02:52:14 +0800 CST

Emular varredura de índice solto para múltiplas colunas com direção de classificação alternada

  • 772

Há algum tempo, fiz esta pergunta sobre como selecionar com eficiência permutações exclusivas de colunas no Postgres. Agora tenho uma pergunta complementar sobre como fazer isso, além de poder ordenar qualquer uma das colunas com qualquer combinação de ASC/ DESCentre as colunas.

A tabela contém centenas de milhões de linhas e, embora a resposta aceita à minha pergunta anterior seja muito mais rápida do que as abordagens tradicionais, não ser capaz de ordenar as colunas de maneira ad-hoc me impede de fazer bom uso dessa consulta ( Eu realmente preciso 'paginar', com LIMIT/ OFFSETem pequenos pedaços). Existe uma maneira de fazer isso? O autor da resposta anterior sugeriu gentilmente uma solução alternativa (alterar a comparação de linhas para uma cláusula where explícita), que tentei, mas não parece funcionar (ou não entendi).

Dada a seguinte consulta genérica:

WITH RECURSIVE cte AS (
   (
   SELECT col1, col2, col3, col4
   FROM   tbl
   ORDER  BY 1,2,3,4
   LIMIT  1
   )
   UNION ALL
   SELECT l.*
   FROM   cte c
   CROSS  JOIN LATERAL (
      SELECT t.col1, t.col2, t.col3, t.col4
      FROM   tbl t
      WHERE (t.col1, t.col2, t.col3, t.col4) > (c.col1, c.col2, c.col3, c.col4)
      ORDER  BY 1,2,3,4
      LIMIT  1
      ) l
   )
SELECT * FROM cte

Existe uma maneira de ordenar as colunas de forma ad hoc, mantendo o desempenho? Por exemplo:

ORDER BY by col1 DESC, col2 ASC, col3 ASC, col4 DESC

Suponha um índice em cada coluna, bem como um índice combinado em todas as 4 colunas.

A versão do Postgres é 15.4.
A tabela é somente leitura no sentido de que os dados não podem/não serão modificados, porém serão adicionados. A seguir está um CREATE TABLEscript para replicar minha tabela problemática (mais ou menos):

CREATE TABLE tbl (id SERIAL primary key, col1 integer NOT NULL, col2 integer NOT NULL, col3 integer NOT NULL, col4 integer NOT NULL);

INSERT INTO tbl (col1, col2, col3, col4) SELECT (random()*1000)::int AS col1, (random()*1000)::int AS col2, (random()*1000)::int AS col3, (random()*1000)::int AS col4 FROM generate_series(1,10000000);

CREATE INDEX ON tbl (col1);
CREATE INDEX ON tbl (col2);
CREATE INDEX ON tbl (col3);
CREATE INDEX ON tbl (col4);
CREATE INDEX ON tbl (col1, col2, col3, col4);
postgresql
  • 1 1 respostas
  • 68 Views

1 respostas

  • Voted
  1. Best Answer
    Erwin Brandstetter
    2024-05-03T05:45:04+08:002024-05-03T05:45:04+08:00

    Basicamente: Não.
    A comparação de valores de linha funciona com ASCENDNGou DESCENDINGordem de classificação, mas não para uma combinação de direções entre campos aninhados. Ver:

    • Termo de sintaxe SQL para 'WHERE (col1, col2) <(val1, val2)'

    No entanto ...

    Solução alternativa para tipos numéricos

    Emulando varredura de salto de índice

    Observe que emular uma varredura de salto de índice só faz sentido para tabelas grandes com muitas duplicatas para seu conjunto de colunas. Mas então isso pode fazer uma diferença de ordens de magnitude .

    Fundamentos:

    • SELECT DISTINCT é mais lento que o esperado na minha tabela no PostgreSQL

    Para ordem de classificação alternada, existem soluções alternativas para tipos de dados numéricos (ou qualquer tipo que possa ser "invertido") com uma expressão de várias colunas index . Basicamente, em vez de col1 DESC, você opera (col1 * -1) ASC- ASCsendo a direção padrão.

    Para o seu exemplo:

    ORDER BY col1 DESC, col2 ASC, col3 ASC, col4 DESC

    CREATE INDEX tbl_1d2a3a4d_idx ON tbl ((col1 * -1), col2, col3, (col4 * -1));  -- !!!
    

    A consulta então se torna:

    WITH RECURSIVE cte AS (
       (
       SELECT col1, col2, col3, col4
       FROM   tbl
       ORDER  BY (col1 * -1), col2, col3, (col4 * -1)              -- !
       LIMIT  1
       )
       UNION ALL
       SELECT l.*
       FROM   cte c
       CROSS  JOIN LATERAL (
          SELECT t.col1, t.col2, t.col3, t.col4
          FROM   tbl t
          WHERE    ((t.col1 * -1), t.col2, t.col3, (t.col4 * -1))  -- !
                 > ((c.col1 * -1), c.col2, c.col3, (c.col4 * -1))  -- !
          ORDER  BY (t.col1 * -1), t.col2, t.col3, (t.col4 * -1)   -- !
          LIMIT  1
          ) l
       )
    SELECT *
    FROM   cte
    

    violino

    O Postgres não pode se contentar com uma varredura somente de índice, pois col1e col4estão ocultos atrás de uma expressão. Dependendo de vários fatores de armazenamento e RAM, pode valer a pena usar um índice de cobertura . Ver:

    • Vantagem de usar INCLUDE em vez de adicionar a coluna em INDEX para cobrir o índice
    CREATE INDEX tbl_1d2a3a4d_covering_idx
    ON tbl ((col1 * -1), col2, col3, (col4 * -1)) INCLUDE (col1, col4);  -- !
    

    Mesma consulta.

    Mas tudo isso ainda está no tópico de "selecionar com eficiência permutações únicas de colunas".

    Paginação

    Você mencionou paginação (com LIMIT/ OFFSET). Você pode basear-se na consulta acima. Como:

    -- query from above
    OFFSET 10000
    LIMIT  10;
    

    Deve funcionar bem. Faz sentido limitado para uso ad hoc .
    Se a tabela não for somente leitura ou quando OFFSET+ LIMITficar grande, a paginação do conjunto de chaves faz mais sentido. Ver:

    • Otimize a consulta com OFFSET em uma tabela grande
    • Paginação eficiente para tabelas grandes

    Materialize linhas exclusivas com um número de linha

    Para uso repetido em uma tabela grande somente leitura , considere uma visualização materializada com um número de linha. Pode ou não fazer sentido se, no seu caso, "linhas serão adicionadas". Você pode usar a consulta acima para criar o MV:

    CREATE MATERIALIZED VIEW mv_tbl AS
    WITH RECURSIVE cte AS (
       (
       SELECT col1, col2, col3, col4
       FROM   tbl
       ORDER  BY (col1 * -1), col2, col3, (col4 * -1)
       LIMIT  1
       )
       UNION ALL
       SELECT l.*
       FROM   cte c
       CROSS  JOIN LATERAL (
          SELECT t.col1, t.col2, t.col3, t.col4
          FROM   tbl t
          WHERE  ((t.col1 * -1), t.col2, t.col3, (t.col4 * -1))
               > ((c.col1 * -1), c.col2, c.col3, (c.col4 * -1))
          ORDER  BY (t.col1 * -1), t.col2, t.col3, (t.col4 * -1)
          LIMIT  1
          ) l
       )
    SELECT row_number() OVER () AS rn, *  -- !
    FROM   cte;
    

    Então, índice e consulta são simples:

    CREATE INDEX mv_tbl_idx ON mv_tbl (rn);  -- !
    
    SELECT rn, col1, col2, col3, col4
    FROM   mv_tbl
    WHERE  rn > 10000
    ORDER  BY rn
    LIMIT  10;
    

    violino

    Existem muitas nuances em tudo isso...

    • 3

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve