Existem ferramentas de benchmarking do MySQL? [fechado]

Question

sipsorcery

Asked: 2012-01-11 18:50:34 +0800 CST2012-01-11 18:50:34 +0800 CST 2012-01-11 18:50:34 +0800 CST

MySQL detecta nomes humanos duplicados [fechado]

772

Fui encarregado de identificar uma solução para ajudar a identificar possíveis duplicatas ao inserir novos registros de usuário em um banco de dados MySQL. Alguém conhece alguma solução barata, de preferência gratuita?

O tipo de duplicatas que preciso detectar são formas comuns de nomes ingleses abreviados - como Bill para William, Bob para Robert etc - junto com erros ortográficos e duplicatas simples. Eu li um pouco sobre o uso do Lucene, mas parece ser mais para pesquisa de texto completo e não tenho certeza se ele suporta a correspondência de nomes duplicados que estou procurando.

1 respostas

Voted

atxdba · Answer 1 · 2012-01-11T19:28:24+08:00

Isso pode ser melhor colocado no estouro de pilha. Isso não é algo que você conseguirá com o MySQL. O que você está falando é chamado de 'derivação' na pesquisa. Semelhante a combinar diferentes conjugações de uma palavra regular, por exemplo, run => runs ,ran.

Não conheço nenhum desses aplicativos para nomes próprios de imediato, mas quando você encontra um que fica ao lado de seu aplicativo principal para "normalizar" o nome antes de inserir o registro em seu banco de dados. Mysql, sqlserver, mongo, qualquer coisa. A tecnologia de banco de dados é irrelevante, pois sua tarefa está fora do escopo de armazenamento de dados/documentos.

Lucene seria uma ferramenta melhor para sua tarefa. Mas eu não poderia falar sobre sua capacidade pré-embalada de conter nomes como você deseja.

Editar

Depois de pensar sobre isso, acho que falei mal quando disse que o Lucene seria uma abordagem "melhor" por si só para o que você deseja. Meu entendimento é que os lematizadores existem fora do lucene principal e, em seguida, fazem uma busca por "bob" em ("bob" ou "robert") para alimentar o mecanismo lucene.

MySQL detecta nomes humanos duplicados [fechado]

Como ver a lista de bancos de dados no Oracle?

Quão grande deve ser o mysql innodb_buffer_pool_size?

Listar todas as colunas de uma tabela especificada

restaurar a tabela do arquivo .frm e .ibd?

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Como selecionar a primeira linha de cada grupo?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

MySQL detecta nomes humanos duplicados [fechado]

1 respostas

relate perguntas