Postgres 10 - A consulta fica mais lenta com a ordem por

Question

Macchiatow

Asked: 2023-04-10 23:41:39 +0800 CST2023-04-10 23:41:39 +0800 CST 2023-04-10 23:41:39 +0800 CST

Índice multichave no Postgres

772

Estou lutando para otimizar a criação correta do índice para minha estrutura de dados. Estou tentando indexar uma grande quantidade de dados (~ 100B registros) do tipo de dados json:

{
  "email": "[email protected]",
  "first_domain": "q.w.e.r.t.y.com"
  "second_domain": "a.s.d.f.g.h.j.com"
}

Uma consulta simples pode parecer

SELECT * 
from table 
WHERE email = '[email protected]'

OU

SELECT * 
from table 
WHERE first_domain LIKE '%.r.t.y.com'
   OR second_domain LIKE '%.r.t.y.com'

Anteriormente, eu tokenizaria todos os domínios e os colocaria juntos em uma matriz no mongo

{
  "values": ["[email protected]", "moc.y.t.r.e.w.q", moc.j.h.g.f.d.s.a]
}

Mas, tendo uma quantidade de dados, o Mongo não pode armazenar todos os valores na memória e o desempenho de gravação diminui.

Então, estou planejando tentar o índice Postgres e GIN. Por favor, sugira-me uma criação de índice adequada para tal situação.

1 respostas

Voted

a_horse_with_no_name · Answer 1 · 2023-04-11T02:17:13+08:00

Best Answer

a_horse_with_no_name

2023-04-11T02:17:13+08:002023-04-11T02:17:13+08:00

A primeira consulta seria escrita corretamente assim:

select *
from the_table
where the_json_column ->> 'email' = '[email protected]'

Isso pode ser suportado com um índice B-Tree:

create index on the_table ((the_json_column ->> 'email'))

Como a condição LIKE usa o caractere curinga no lado esquerdo, você precisará de um índice de trigrama (após instalar a pg_trgmextensão)

create index on the_table using gin ((the_json_column ->> 'first_domain') gin_trgm_ops);
create index on the_table using gin ((the_json_column ->> 'second_domain') gin_trgm_ops);

Novamente, você precisa usar a sintaxe correta para extrair os valores da coluna JSON:

SELECT * 
from the_table 
WHERE the_json_column ->> 'first_domain' LIKE '%.r.t.y.com'
   OR the_json_column ->> 'second_domain' LIKE '%.r.t.y.com'

1

Índice multichave no Postgres

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Índice multichave no Postgres

1 respostas

relate perguntas