AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 59262
Accepted
dendini
dendini
Asked: 2014-02-21 03:14:18 +0800 CST2014-02-21 03:14:18 +0800 CST 2014-02-21 03:14:18 +0800 CST

Design completo do banco de dados vs Comparação de design rápido e sujo

  • 772

Pegue a representação de um endereço, abaixo está uma implementação completa e muito detalhada:

representação de endereço

aqui, em vez disso, é uma implementação rápida (que contém mais ou menos os mesmos campos, imagine que todos os campos do primeiro também estejam contidos no segundo)

representação de endereço rápida

Se eu fosse decidir qual é o mais próximo de um normalizado e academicamente correto, eu diria o primeiro, mas se eu fosse iniciar um projeto, iria com o segundo.

Você concorda com esta consideração? E se sim, como se lida com esse fato?

  1. comece com um banco de dados fácil e, assim que for a hora, melhore-o para um banco de dados mais normalizado/acadêmico.
  2. comece com algo o mais próximo possível do banco de dados acadêmico
  3. ficar com a solução rápida e suja
database-design database-recommendation
  • 3 3 respostas
  • 618 Views

3 respostas

  • Voted
  1. Best Answer
    Joel Brown
    2014-02-21T04:31:37+08:002014-02-21T04:31:37+08:00

    Tentar normalizar endereços geralmente é uma má ideia. Não há muito valor em normalizar endereços. Ambos os designs são inadequados para a grande maioria dos sistemas.

    Há duas coisas que você normalmente faz com endereços:

    1. Use-os para enviar correspondência ou pacotes para esse local.
    2. Use-os para fazer análises geoespaciais naquele local.

    Como você está usando estados, províncias e distritos em seu projeto, e não prefeituras, por exemplo, presumo que você esteja trabalhando em um contexto norte-americano. Se isso for verdade, então você tem autoridades postais bem estabelecidas (USPS, CPC) com dados postais muito bem regulamentados e ferramentas de qualidade de dados de endereço prontamente disponíveis. Mesmo se você estiver trabalhando fora dos EUA/Canadá, provavelmente existem ferramentas de qualidade de dados que farão o que você precisa.

    Com a validação e padronização de seus dados de endereço, você pode ter certeza de que conseguirá atingir sua primeira meta.

    Usando o CEP+4 nos EUA e o código postal em muitos outros países, você pode obter tudo o que precisa para sua segunda meta.

    Muitas pessoas são realmente tentadas a dividir os endereços em campos granulares. Esta é uma reação a como os dados de endereço geralmente são ruins quando tudo o que você tem é "address_line_1, address_line_2,...". No entanto, colocar nomes de cidades ruins e não validados em seu próprio campo significa apenas que você tem uma pilha menor de lixo em vez de uma pilha maior. A única maneira de resolver isso é usar uma ferramenta de qualidade de dados de endereço para validar e padronizar seus endereços. Se você tentar normalizar seus dados de endereço, acabará com uma grande pilha de associações muitos-para-muitos. Isso ocorre porque os endereços na vida real não se encaixam nas hierarquias organizadas que você veria em um livro didático.

    A menos que você tenha alguma necessidade realmente especializada de endereços, apenas mantenha suas tabelas simples (algumas linhas de endereço, talvez com o código postal quebrado) e obtenha uma boa ferramenta de qualidade de dados de endereço para limpar os dados no caminho.

    • 8
  2. pnomolos
    2014-02-21T09:25:36+08:002014-02-21T09:25:36+08:00

    Minha preferência seria algo no meio. Como estados/províncias e países são entidades bem estabelecidas que não mudam com o tempo, você pode retirá-los em tabelas separadas. No entanto, tentar normalizar os dados de nível de rua e cidade enquanto confia na entrada humana é, na melhor das hipóteses, propenso a erros e, na pior das hipóteses, você acabará com algumas informações muito ruins em seu banco de dados.

    • 2
  3. Wouter
    2014-02-21T04:53:43+08:002014-02-21T04:53:43+08:00

    Acho que a "maneira academicamente correta" não é fornecer funcionalidade para todos os detalhes que possam se apresentar no objeto da vida real que você está modelando. Acho que significa simplesmente que -se- você precisa desse nível de detalhe, -isto- é agora que você deve normalizá-lo.

    Indo na mesma direção da "solução 1", você também pode começar a criar tabelas para locais que receberam um novo nome ao longo do tempo ou regiões que foram absorvidas por outras regiões vizinhas ao longo do tempo. Você poderia implementar detalhes ao infinito.

    Portanto, a questão é -sempre-, qual funcionalidade você precisa e qual é a maneira mais simples de implementá-la de forma normalizada. A solução "rápida e suja" parece perfeitamente normalizada para mim, se essa é a funcionalidade que você está procurando.

    • 0

relate perguntas

  • Qual é a diferença entre os tipos de dados MySQL VARCHAR e TEXT?

  • É melhor armazenar os valores calculados ou recalculá-los a pedido? [duplicado]

  • Armazenar vs calcular valores agregados

  • Quais bancos de dados são recomendados para serem usados ​​como bancos de dados integrados?

  • Quais são algumas maneiras de implementar um relacionamento muitos-para-muitos em um data warehouse?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve