AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77030106
Accepted
MACE
MACE
Asked: 2023-09-03 05:22:05 +0800 CST2023-09-03 05:22:05 +0800 CST 2023-09-03 05:22:05 +0800 CST

Como compor uma consulta JSON confusa e desleixada para a API REST do Elasticsearch do Art Institute of Chicago

  • 772

Eu tenho um arquivo com nomes de artistas. Estou tentando pesquisar na API REST do Art Institute of Chicago em busca de obras desses artistas. Um dos nomes no arquivo era 'Romare Beardon'. Minha consulta do Elasticsearch não encontrou nada.

criteria = {
  "query": {"match_phrase" : {"artist_title": "romare beardon"}}
}

O problema é que o arquivo escreveu incorretamente o sobrenome (s/b 'Bearden') e o Instituto lista o nome do artista como 'Romare Howard Bearden'.

Portanto, minha consulta precisa perdoar pequenos erros ortográficos e levar em conta nomes do meio.

Eu experimentei com desleixo"

criteria = {
  "query" : {"match_phrase": {"artist_title": {"query":"Romare Bearden", "slop":1 }}},
}

Isto encontra corretamente Romare Howard Bearden!

E eu experimentei imprecisão:

criteria = {
    "query": {
        "fuzzy" : {"artist_title": {"value": "Beardon", "fuzziness": "AUTO"}}},
}

Isto encontra 'Bearden', mas também encontra 'Pearson'. Não aceitável.

Alterar AUTO para 1 não retorna nada. Alterar AUTO para 2 retorna 'Bearden' e 'Pearson'. Não aceitável.

Alguém pode me ajudar a escrever uma consulta que possa pegar 'Romare Beardon' e encontrar 'Romare Howard Bearden'. Ele precisa ser generalizado para que qualquer nome e sobrenome, mesmo que ligeiramente incorreto, encontre o primeiro meio e o último com alta precisão.

elasticsearch
  • 1 1 respostas
  • 16 Views

1 respostas

  • Voted
  1. Best Answer
    Ayushi Srivastava
    2023-09-04T02:45:38+08:002023-09-04T02:45:38+08:00

    Posso pensar em uma solução possível onde você pode dividir artist_titleo texto em palavras e depois aplicar imprecisão no texto de pesquisa como:

    O seguinte analisador de espaços em branco pode ser especificado ao criar o mapeamento para o índice elástico:

    {
        "mappings": {
            "properties": {
                "artist_title": {
                    "type": "text",
                    "analyzer": "whitespace"
                }
            }
        }
    }
    

    Como mencionado acima, os artist_title presentes em elastic são Romare Howard Beardene Pearson.

    Para um texto de pesquisa: Romar Beardon, a consulta de pesquisa com imprecisão seria:

    {
        "query": {
            "bool": {
                "must": [
                    {
                        "fuzzy": {
                            "artist_title": {
                                "value": "Romar",
                                "fuzziness": "AUTO"
                            }
                        }
                    },
                    {
                        "fuzzy": {
                            "artist_title": {
                                "value": "Beardon",
                                "fuzziness": "AUTO"
                            }
                        }
                    }
                ]
            }
        }
    }
    

    Isso daria o resultado pretendido Romare Howard Beardencom texto desleixado e combinação de nome e sobrenome.

    Explicação:

    Durante a criação do mapeamento, o analisador de espaços em branco quebraria o texto e os indexaria separadamente, o que mais tarde, quando consultado separadamente como texto difuso, produziria o resultado. No entanto, o texto de pesquisa precisa ser dividido e adicionado separadamente como consulta difusa. O fuzzinessvalor pode ser alterado de AUTO para qualquer número inteiro para especificar o número de imprecisão a ser aplicado.

    Para AUTO, de acordo com Documentos :

    Gera uma distância de edição com base na duração do termo. Argumentos de distância baixa e alta podem ser fornecidos opcionalmente AUTO:[low],[high]. Se não for especificado, os valores padrão são 3 e 6, equivalentes a AUTO:3,6 que determinam comprimentos:

    0..2
    Must match exactly
    3..5
    One edit allowed
    >5
    Two edits allowed
    

    Alternativamente, se "fuzziness": "2", o número máximo de caracteres difusos permitidos é 2 para produzir um resultado de pesquisa. Por exemplo, Romatambém produziria o resultado da pesquisa com 2 caracteres re eestá faltando.

    Espero que isto ajude.

    • 1

relate perguntas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve