Tenho uma ferramenta de busca no meu site que faz tanto buscas tradicionais de texto completo quanto buscas usando embeddings. Por exemplo, quando você pesquisa "balão vermelho", quero resultados de texto e imagem. O problema é que nem todos os termos de busca fazem sentido para a detecção de objetos (como "William" ou mesmo um identificador, como o número da carteira de motorista). Sei que existem bibliotecas que me dizem se uma palavra é um substantivo, mas existe alguma que me diga se uma frase é pesquisável? Assim:
- Maçã Vermelha SIM
- Grande Ideia Não
- Carteira de Habilitação SIM
- Licença suspensa nº