AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 68218
Accepted
andrewniesen
andrewniesen
Asked: 2014-06-14 08:18:13 +0800 CST2014-06-14 08:18:13 +0800 CST 2014-06-14 08:18:13 +0800 CST

Legendas de fotos e associações de palavras-chave

  • 772

Estou criando um banco de dados que referencia imagens. Palavras-chave e legendas farão parte dos metadados. Essas legendas e palavras-chave não são necessariamente adicionadas às fotos com a intenção de facilitar buscas de qualidade.

Gostaria de converter efetivamente as informações nas legendas em palavras-chave. Obviamente, algumas das palavras nas legendas não serão úteis (por exemplo, "the","he","she","of",etc.) e eu as excluiria, mas outras palavras serão muito úteis, especialmente se forem aparecem em combinação com outras palavras.

Estou tentando descobrir a melhor maneira de associar essas palavras-chave e palavras das legendas às imagens. Seria melhor criar uma tabela de imagens (nomes de arquivo, caminho para arquivo, tamanho, etc.) e uma tabela de palavras, onde cada palavra tem um ID e, em seguida, uma tabela associativa que referencia as palavras às imagens? Ou talvez duas tabelas associativas, uma para vincular palavras de legenda e outra para vincular palavras-chave?

Será esta uma boa abordagem?

normalization metadata
  • 1 1 respostas
  • 67 Views

1 respostas

  • Voted
  1. Best Answer
    dartonw
    2014-06-14T12:42:35+08:002014-06-14T12:42:35+08:00

    A melhor solução depende do seu RDBMS, mas em geral você não precisa limpar manualmente as legendas porque o banco de dados terá uma "lista de palavras irrelevantes" ou "lista de palavras irrelevantes" que é usada para excluir palavras de um índice de texto completo (não o o mesmo que um índice clusterizado/não clusterizado regular). Você pode modificar essa lista para especificar quais palavras são excluídas do índice de texto completo. Na maioria dos bancos de dados, a lista já incluiria preposições, pronomes e outras palavras de ruído, o que significa que uma pesquisa por pássaros E vôo retornaria uma legenda de "pássaros em vôo" (supondo que exista). Além disso, a maioria dos sistemas pode conter os termos indexados e fornecer a capacidade de pesquisar as flexões de um termo, por exemplo, pesquisar as flexões de "voar" retornará voando, voou, voou, etc.

    Se as legendas forem as palavras-chave, você não precisará analisar as palavras-chave delas; basta adicionar um índice de texto completo à coluna de legenda. Se você tiver ou quiser adicionar mais palavras-chave além das legendas, poderá indexá-las separadamente e usá-las para aumentar ou modificar a pesquisa de legenda usando a classificação/pontuação numérica incorporada do RDBMS dos resultados - uma ocorrência em uma palavra-chave pode aumentar a classificação enquanto uma falha não pode fazer nada ou até diminuí-la.

    Se as legendas tiverem uma relação de 1:1 com as imagens (o que geralmente acontece), você nem precisa de uma tabela separada para elas; basta armazenar a legenda em outra coluna da tabela de imagens. Palavras-chave adicionais podem ser normalizadas e armazenadas em uma tabela separada, o que exigiria uma tabela de junção intermediária com chaves estrangeiras de imagens e palavras-chave. No entanto, isso aumenta a complexidade e você pode achar melhor apenas armazenar uma lista de palavras delimitadas por espaços em outra coluna na tabela de imagens.

    A solução que você selecionar dependerá de vários fatores, incluindo necessidades de negócios, requisitos de desempenho e casos de uso, ou seja, quais tipos de pesquisas você precisa oferecer suporte: frase exata, booleano AND/OR, correspondências difusas como SOUNDEX, etc. Às vezes, a indexação de texto completo não é nem é necessário. Por exemplo, se a exclusão de palavras derivadas e de ruído não for importante, uma pesquisa usando LIKE com curingas pode ser suficiente.

    • 1

relate perguntas

  • O que é relação atômica na primeira forma normal

  • Questão do banco de dados do dicionário multilíngue

  • Coluna duplicada para consultas mais rápidas?

  • As formas normalizadas superiores sempre atendem aos critérios das inferiores?

  • Recursos de exercícios de normalização

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve