Sequências Biológicas do UniProt no PostgreSQL

Question

David Eyk

Asked: 2011-08-10 15:04:10 +0800 CST2011-08-10 15:04:10 +0800 CST 2011-08-10 15:04:10 +0800 CST

Como criar um índice para acelerar uma consulta LIKE agregada em uma expressão?

772

Posso estar fazendo a pergunta errada no título. Aqui estão os fatos:

Meu pessoal de atendimento ao cliente tem reclamado dos tempos de resposta lentos ao fazer pesquisas de clientes na interface de administração do nosso site baseado em Django.

Estamos usando o Postgres 8.4.6. Comecei a registrar consultas lentas e descobri este culpado:

SELECT COUNT(*) FROM "auth_user" WHERE UPPER("auth_user"."email"::text) LIKE UPPER(E'%deyk%')

Esta consulta está demorando mais de 32 segundos para ser executada. Aqui está o plano de consulta fornecido pelo EXPLAIN:

QUERY PLAN
Aggregate  (cost=205171.71..205171.72 rows=1 width=0)
  ->  Seq Scan on auth_user  (cost=0.00..205166.46 rows=2096 width=0)
        Filter: (upper((email)::text) ~~ '%DEYK%'::text)

Como esta é uma consulta gerada pelo Django ORM a partir de um Django QuerySet gerado pelo aplicativo Django Admin, não tenho nenhum controle sobre a consulta em si. Um índice parece ser a solução lógica. Eu tentei criar um índice para acelerar isso, mas não fez diferença:

CREATE INDEX auth_user_email_upper ON auth_user USING btree (upper(email::text))

O que estou fazendo errado? Como posso acelerar esta consulta?

2 respostas

Voted

Erwin Brandstetter · Answer 1 · 2012-07-29T10:43:33+08:00

Best Answer

Erwin Brandstetter

2012-07-29T10:43:33+08:002012-07-29T10:43:33+08:00

Não há suporte de índice para LIKE/ ILIKEno PostgreSQL 8.4 - exceto para termos de pesquisa ancorados à esquerda .

Desde o PostgreSQL 9.1 o módulo adicional pg_trgmfornece classes de operadores para índices de trigramas GIN e GiST que suportam LIKE/ ILIKEou expressões regulares (operadores ~e amigos). Instale uma vez por banco de dados:

CREATE EXTENSION IF NOT EXISTS pg_trgm;

Exemplo de índice GIN:

CREATE INDEX tbl_col_gin_trgm_idx ON tbl USING gin (col gin_trgm_ops);

Relacionado:

34

TomH · Answer 2 · 2011-08-10T15:09:36+08:00

Esse índice não vai ajudar por causa do '%' no início de sua correspondência - um índice BTREE só pode corresponder a prefixos e o curinga no início de sua consulta significa que não há prefixo fixo para procurar.

É por isso que está fazendo uma varredura de tabela e correspondendo a cada registro por sua vez com a string de consulta.

Você provavelmente precisa usar um índice de texto completo e os operadores de correspondência de texto em vez de fazer a pesquisa de substring com LIKE que você está no momento. Você pode encontrar mais informações sobre pesquisa de texto completo na documentação:

http://www.postgresql.org/docs/8.4/static/textsearch-intro.html

Na verdade, noto nessa página que LIKE aparentemente nunca usa índices, o que me parece estranho, pois deveria ser capaz de resolver prefixos não curinga usando um índice BTREE. No entanto, alguns testes rápidos sugerem que a documentação provavelmente está correta; nesse caso, nenhuma quantidade de indexação ajudará enquanto você estiver usando LIKE para resolver a consulta.

Como criar um índice para acelerar uma consulta LIKE agregada em uma expressão?

Como você mysqldump tabela (s) específica (s)?

Como você mostra o SQL em execução em um banco de dados Oracle?

Como selecionar a primeira linha de cada grupo?

Listar os privilégios do banco de dados usando o psql

Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

Como uso currval() no PostgreSQL para obter o último id inserido?

Como executar o psql no Mac OS X?

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Passando parâmetros de array para um procedimento armazenado

Como criar um índice para acelerar uma consulta LIKE agregada em uma expressão?

2 respostas

relate perguntas