Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

Question

MACE

Asked: 2023-09-03 05:22:05 +0800 CST2023-09-03 05:22:05 +0800 CST 2023-09-03 05:22:05 +0800 CST

Como compor uma consulta JSON confusa e desleixada para a API REST do Elasticsearch do Art Institute of Chicago

772

Eu tenho um arquivo com nomes de artistas. Estou tentando pesquisar na API REST do Art Institute of Chicago em busca de obras desses artistas. Um dos nomes no arquivo era 'Romare Beardon'. Minha consulta do Elasticsearch não encontrou nada.

criteria = {
  "query": {"match_phrase" : {"artist_title": "romare beardon"}}
}

O problema é que o arquivo escreveu incorretamente o sobrenome (s/b 'Bearden') e o Instituto lista o nome do artista como 'Romare Howard Bearden'.

Portanto, minha consulta precisa perdoar pequenos erros ortográficos e levar em conta nomes do meio.

Eu experimentei com desleixo"

criteria = {
  "query" : {"match_phrase": {"artist_title": {"query":"Romare Bearden", "slop":1 }}},
}

Isto encontra corretamente Romare Howard Bearden!

E eu experimentei imprecisão:

criteria = {
    "query": {
        "fuzzy" : {"artist_title": {"value": "Beardon", "fuzziness": "AUTO"}}},
}

Isto encontra 'Bearden', mas também encontra 'Pearson'. Não aceitável.

Alterar AUTO para 1 não retorna nada. Alterar AUTO para 2 retorna 'Bearden' e 'Pearson'. Não aceitável.

Alguém pode me ajudar a escrever uma consulta que possa pegar 'Romare Beardon' e encontrar 'Romare Howard Bearden'. Ele precisa ser generalizado para que qualquer nome e sobrenome, mesmo que ligeiramente incorreto, encontre o primeiro meio e o último com alta precisão.

1 respostas

Voted

Ayushi Srivastava · Answer 1 · 2023-09-04T02:45:38+08:00

Posso pensar em uma solução possível onde você pode dividir artist_titleo texto em palavras e depois aplicar imprecisão no texto de pesquisa como:

O seguinte analisador de espaços em branco pode ser especificado ao criar o mapeamento para o índice elástico:

{
    "mappings": {
        "properties": {
            "artist_title": {
                "type": "text",
                "analyzer": "whitespace"
            }
        }
    }
}

Como mencionado acima, os artist_title presentes em elastic são Romare Howard Beardene Pearson.

Para um texto de pesquisa: Romar Beardon, a consulta de pesquisa com imprecisão seria:

{
    "query": {
        "bool": {
            "must": [
                {
                    "fuzzy": {
                        "artist_title": {
                            "value": "Romar",
                            "fuzziness": "AUTO"
                        }
                    }
                },
                {
                    "fuzzy": {
                        "artist_title": {
                            "value": "Beardon",
                            "fuzziness": "AUTO"
                        }
                    }
                }
            ]
        }
    }
}

Isso daria o resultado pretendido Romare Howard Beardencom texto desleixado e combinação de nome e sobrenome.

Explicação:

Durante a criação do mapeamento, o analisador de espaços em branco quebraria o texto e os indexaria separadamente, o que mais tarde, quando consultado separadamente como texto difuso, produziria o resultado. No entanto, o texto de pesquisa precisa ser dividido e adicionado separadamente como consulta difusa. O fuzzinessvalor pode ser alterado de AUTO para qualquer número inteiro para especificar o número de imprecisão a ser aplicado.

Para AUTO, de acordo com Documentos :

Gera uma distância de edição com base na duração do termo. Argumentos de distância baixa e alta podem ser fornecidos opcionalmente AUTO:[low],[high]. Se não for especificado, os valores padrão são 3 e 6, equivalentes a AUTO:3,6 que determinam comprimentos:
0..2
Must match exactly
3..5
One edit allowed
>5
Two edits allowed

Alternativamente, se "fuzziness": "2", o número máximo de caracteres difusos permitidos é 2 para produzir um resultado de pesquisa. Por exemplo, Romatambém produziria o resultado da pesquisa com 2 caracteres re eestá faltando.

Espero que isto ajude.

Como compor uma consulta JSON confusa e desleixada para a API REST do Elasticsearch do Art Institute of Chicago

destaque o código em HTML usando <font color="#xxx">