Posso ativar o PITR depois que o banco de dados foi usado

Question

Tom

Asked: 2022-03-11 05:50:08 +0800 CST2022-03-11 05:50:08 +0800 CST 2022-03-11 05:50:08 +0800 CST

Condições duplicadas na consulta PostgreSQL

772

O uso de condições duplicadas no PostgreSQL pode causar algum problema?

Por exemplo, tenho uma tabela de compras com um ID de cliente e minha estrutura em alguns casos duplica uma condição de pesquisa, como no exemplo abaixo.

SELECT p.*
FROM purchases p
WHERE p.customer_id = 123 
AND p.customer_id = 123;

OU

SELECT p.*
FROM purchases p
WHERE p.customer_id = 123 
AND p.salesman = 456 
AND p.departament = 789 
AND p.customer_id = 123;

2 respostas

Voted

Laurenz Albe · Answer 1 · 2022-03-11T05:56:08+08:00

Best Answer

Laurenz Albe

2022-03-11T05:56:08+08:002022-03-11T05:56:08+08:00

Sim, isso pode causar estimativas de consulta incorretas. Se o PostgreSQL achar que WHERE p.customer_id = 123retornará 10% das linhas da tabela, ele pensará que WHERE p.customer_id = 123 AND p.customer_id = 123retornará apenas 1% da tabela, pois não percebe que as condições são realmente as mesmas e as trata como estatisticamente independentes.

Estimativas ruins podem levar a más escolhas de planos e mau desempenho.

Talvez isso não importe tanto no seu caso: o PostgreSQL coloca um limite inferior de 1 em cada estimativa de contagem de linhas, portanto, se sua consulta deduplicada já estiver estimada para retornar muito poucas linhas, não haverá muito dano.

Experimente usar EXPLAIN!

4

David Aldridge · Answer 2 · 2022-03-12T00:32:46+08:00

De acordo com meus testes em 12.6, depende do predicado:

db=# explain select * from books where product_form = 'BB';
                                                  QUERY PLAN                                                    
-----------------------------------------------------------------------------------------------------------------
Index Scan using index_books_on_client_id_and_product_form on books  (cost=0.29..7273.75 rows=3604 width=23686)
  Index Cond: ((product_form)::text = 'BB'::text)
(2 rows)

db=# explain select * from books where product_form = 'BB' and product_form = 'BB' ;
                                                  QUERY PLAN                                                    
-----------------------------------------------------------------------------------------------------------------
Index Scan using index_books_on_client_id_and_product_form on books  (cost=0.29..7273.75 rows=3604 width=23686)
  Index Cond: ((product_form)::text = 'BB'::text)
(2 rows)

db=# explain select * from books where product_form = 'BB' and product_form = 'BB' and product_form = 'BB' ;
                                                  QUERY PLAN                                                    
-----------------------------------------------------------------------------------------------------------------
Index Scan using index_books_on_client_id_and_product_form on books  (cost=0.29..7273.75 rows=3604 width=23686)
  Index Cond: ((product_form)::text = 'BB'::text)
(2 rows)

Então, nesse caso, não há problema. A estimativa de linha e os custos são constantes.

Possivelmente isso ocorre porque um índice está envolvido, porque um predicado ilike é afetado negativamente por isso:

db=# explain select * from books where title ilike '%phys%';
                          QUERY PLAN                          
--------------------------------------------------------------
Seq Scan on books  (cost=0.00..7613.31 rows=539 width=23686)
  Filter: ((title)::text ~~* '%phys%'::text)
(2 rows)

db=# explain select * from books where title ilike '%phys%' and  title ilike '%phys%';
                                      QUERY PLAN                                       
---------------------------------------------------------------------------------------
Seq Scan on books  (cost=0.00..7676.98 rows=11 width=23686)
  Filter: (((title)::text ~~* '%phys%'::text) AND ((title)::text ~~* '%phys%'::text))
(2 rows)

db=# explain select * from books where title ilike '%phys%' and  title ilike '%phys%' and title ilike '%phys%';
                                                          QUERY PLAN                                                          
------------------------------------------------------------------------------------------------------------------------------
Seq Scan on books  (cost=0.00..7740.64 rows=1 width=23686)
  Filter: (((title)::text ~~* '%phys%'::text) AND ((title)::text ~~* '%phys%'::text) AND ((title)::text ~~* '%phys%'::text))
(2 rows)

Observe o pequeno aumento no custo e a redução na contagem de linhas estimadas.

Eu acho que isso também pode ser sensível à versão, então sugiro que você verifique sua versão com os predicados e o esquema com os quais você está preocupado.

Condições duplicadas na consulta PostgreSQL

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Condições duplicadas na consulta PostgreSQL

2 respostas

relate perguntas