Posso ativar o PITR depois que o banco de dados foi usado

Question

Marcus Junius Brutus

Asked: 2016-02-17 05:58:25 +0800 CST2016-02-17 05:58:25 +0800 CST 2016-02-17 05:58:25 +0800 CST

Pesquisa de texto completo em documentos XML

772

Eu gostaria de fazer pesquisa de texto completo em documentos XML.

No entanto, não consigo obter correspondências para valores de atributo (obtenho um erro de sintaxe se fornecer o valor de atributo completo, incluindo os caracteres :e /no exemplo abaixo). Além disso, não sei como especificar meus próprios delimitadores para o analisador.

Abaixo está o SSCCE:

Eu gostaria de ser capaz de selecionar o último componente do atributo value: attributevaluee para o analisador reconhecer :e /como delimitadores e assim produzir boo1, boo2e somecomo attributevaluelexemas.

DROP TABLE IF EXISTS xmldocument;
CREATE TABLE IF NOT EXISTS xmldocument (
i SERIAL NOT NULL,
content XML NOT NULL
);
ALTER TABLE xmldocument ADD PRIMARY KEY (i);

INSERT INTO xmldocument (content) VALUES
('<a>foo</a>')
,('<a boo=''boo1:boo2:boo3/boo4/some/attributevalue''>foo</a>')
;


-- matches both records as expected
SELECT * FROM xmldocument WHERE to_tsvector(CAST (content AS VARCHAR))@@'foo'; 

-- no match
SELECT * FROM xmldocument WHERE to_tsvector(CAST (content AS VARCHAR))@@'attributevalue'; 

-- no match
SELECT * FROM xmldocument WHERE to_tsvector(CAST (content AS VARCHAR))@@'boo2'; 

 -- no match
 SELECT * FROM xmldocument WHERE to_tsvector(CAST (content AS VARCHAR))@@'boo4';

Quanto ao motivo de não usar apenas ILIKE %etc. O motivo é que preciso otimizar usando um índice GIN e não acho que seja possível ou significativo criar um índice com valores VARCHAR simples.

*atualize após aceitar a resposta*

Com base na resposta aceita, todas as consultas a seguir funcionam conforme o esperado:

SELECT * FROM fts.xmldocument WHERE 
to_tsvector(regexp_replace(content::text,'[<>/]',' ','g')) @@ to_tsquery('foo');

SELECT * FROM fts.xmldocument WHERE
to_tsvector(regexp_replace(content::text,'[<>/]',' ','g')) @@ to_tsquery('attributevalue');

SELECT * FROM fts.xmldocument WHERE
to_tsvector(regexp_replace(content::text,'[<>/]',' ','g')) @@ to_tsquery('boo2');

SELECT * FROM fts.xmldocument WHERE
to_tsvector(regexp_replace(content::text,'[<>/]',' ','g')) @@ to_tsquery('boo4');

1 respostas

Voted

jjanes · Answer 1 · 2016-02-17T11:10:15+08:00

Best Answer

jjanes

2016-02-17T11:10:15+08:002016-02-17T11:10:15+08:00

Se você não quiser escrever seu próprio analisador, a solução rápida e suja seria substituir <e >por alguma outra pontuação, para que os analisadores existentes não decidam descartá-los como tags html.

SELECT * 
FROM xmldocument 
WHERE to_tsvector(regexp_replace(content::text,'[<>]',' ','g')) @@ 'boo2';

Quanto ao motivo pelo qual não uso apenas ILIKE% etc., o motivo é que preciso otimizar usando um índice GIN e não acho que seja possível ou significativo criar um índice em valores VARCHAR simples.

Se você usar a pg_trgmextensão, poderá criar um índice gin nos valores VARCHAR que otimizará as consultas ILIKE. Sua eficácia depende do tamanho de seus documentos indexados e do tamanho de sua consulta. Eu recomendo tentar e ver como funciona para você.

A versão 1.2 do pg_trgm (a ser incluída no PostgreSQL 9.6, mas é bastante fácil fazer back-port para 9.4 e 9.5 se você estiver disposto a compilar algum código) será muito mais eficaz com consultas grandes.

4

Pesquisa de texto completo em documentos XML

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Pesquisa de texto completo em documentos XML

1 respostas

relate perguntas