AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 157951
Accepted
xangr
xangr
Asked: 2016-12-13 12:18:39 +0800 CST2016-12-13 12:18:39 +0800 CST 2016-12-13 12:18:39 +0800 CST

Obter correspondência parcial da coluna TSVECTOR indexada por GIN

  • 772

Eu gostaria de obter resultados por consulta isso:

SELECT *
FROM  (
   SELECT id, subject
   FROM mailboxes
   WHERE tsv @@ plainto_tsquery('avail')
   ) AS t1
ORDER BY id DESC;

Isso funciona e retorna linhas tsvcontendo 'Available' . Mas se eu usar 'avai' (truncando '...lable') ele não encontra nada.

Todas as consultas precisam estar no dicionário? Não podemos simplesmente consultar essas cartas? Tenho uma tabela que contém corpos de e-mail (conteúdo) e gostaria de fazer consultas rápidas pois ela cresce rapidamente. Atualmente, estou usando:

... WHERE content ~* 'avail'
postgresql full-text-search
  • 1 1 respostas
  • 21064 Views

1 respostas

  • Voted
  1. Best Answer
    Erwin Brandstetter
    2016-12-13T18:46:05+08:002016-12-13T18:46:05+08:00

    Todas as consultas precisam estar no dicionário?

    Não. Porque apenas os radicais das palavras (de acordo com a configuração de pesquisa de texto usada ) estão no índice para começar. Mas mais importante:

    Não . Porque, além disso, a pesquisa de texto completo também é capaz de correspondência de prefixo :

    Isso funcionaria:

    SELECT id, subject
    FROM   mailboxes
    WHERE  tsv @@ to_tsquery('simple', 'avail:*')
    ORDER  BY id DESC;

    Observe 3 coisas:

    1. Use to_tsquery(), not plainto_tsquery(), neste caso porque ( citando o manual ):

      ... plainto_tsquerynão reconhecerá tsqueryoperadores, rótulos de peso ou rótulos de correspondência de prefixo em sua entrada

    2. Use a 'simple'configuração de pesquisa de texto para gerar o tsquerydesde que você obviamente queira usar a palavra 'avail' como está e não aplicar a derivação.

    3. Acrescente :*para torná-lo uma pesquisa de prefixo, ou seja, encontre todos os lexemas começando com 'avail'.

    Importante: Esta é uma pesquisa de prefixo em lexemas (raízes de palavras) no documento. Uma correspondência de expressão regular sem curingas ( content ~* 'avail') não é exatamente a mesma! O último não é ancorado à esquerda (no início dos lexemas) e também encontraria 'FOOavail' etc.

    Não está claro se você deseja o comportamento descrito em sua consulta ou o equivalente à expressão regular adicionada. Índices de trigramas usando o módulo adicional ( pg_trgm) são a ferramenta certa para isso. Existem muitas questões relacionadas em dba.SE, tente uma pesquisa .

    Visão geral:

    • Correspondência de padrões com LIKE, SIMILAR TO ou expressões regulares no PostgreSQL

    Demonstração

    SELECT *
    FROM  (
       VALUES
         ('Zend has no framework')
       , ('Zend Framework')
       ) sub(t), to_tsvector(t) AS tsv
    WHERE  tsv @@ to_tsquery('zend <-> fram:*');
    
     id |       t        |          tsv
    ----+----------------+------------------------
      2 | Zend Framework | 'framework':2 'zend':1
    

    Resposta relacionada (capítulo "Abordagem diferente para otimizar a pesquisa" ):

    • Como posso gerar todas as substrings à direita após um delimitador?

    E-mails?

    Como você mencionou e-mails, esteja ciente de que o analisador de pesquisa de texto identifica e-mails e não os divide em palavras / lexemas separados. Considerar:

    SELECT ts_debug('english', '[email protected]')
    
    (email,"Email address",[email protected],{simple},simple,{[email protected]})
    

    Eu substituiria os separadores @e .em seus e-mails por espaço ( ' ') para indexar as palavras contidas.

    Além disso, como você está lidando com nomes em e-mails, não com palavras em inglês (ou algum outro idioma) , eu usaria a 'simple'configuração de pesquisa de texto para desabilitar o tema e outros recursos de idioma :

    Construa a ts_vectorcoluna com:

    SELECT to_tsvector('simple', translate('[email protected]', '@.', '  ')) AS tsv;
    
    • 31

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve