AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 9011
Accepted
Brad Turner
Brad Turner
Asked: 2011-12-10 16:39:15 +0800 CST2011-12-10 16:39:15 +0800 CST 2011-12-10 16:39:15 +0800 CST

Uso adequado de tabelas de pesquisa

  • 772

Estou tendo problemas para descobrir exatamente como colocar bons limites para quando e onde usar tabelas de pesquisa em um banco de dados. A maioria das fontes que consultei dizem que nunca é demais, mas, em algum momento, parece que o banco de dados seria dividido em tantos pedaços que, embora possa ser eficiente, não é mais gerenciável. Aqui está um exemplo combinado do que estou trabalhando:

Digamos que eu tenha uma tabela chamada Funcionários:

ID  LName   FName   Gender  Position
1   Doe     John    Male    Manager
2   Doe     Jane    Female  Sales
3   Smith   John    Male    Sales

Imagine por um momento que os dados são mais complexos e contêm centenas de linhas. A coisa mais óbvia que vejo que poderia ser movida para uma tabela de pesquisa seria Posição. Eu poderia criar uma tabela chamada Positions e colocar as chaves estrangeiras da tabela Positions na tabela Employees na coluna Position.

ID  Position
1   Manager
2   Sales

Mas até que ponto posso continuar a dividir as informações em tabelas de pesquisa menores antes que elas se tornem incontroláveis? Eu poderia criar uma tabela de gênero e ter 1 correspondendo a masculino e 2 correspondendo a feminino em uma tabela de pesquisa separada. Eu poderia até colocar LNames e FNames em tabelas. Todas as entradas "John" são substituídas por uma chave estrangeira de 1 que aponta para a tabela FName que diz que um ID de 1 corresponde a John. No entanto, se você for longe demais nessa toca do coelho, sua tabela Employees será reduzida a uma confusão de chaves estrangeiras:

ID  LName   FName   Gender  Position
1   1       1       1       1
2   1       2       2       2
3   2       1       1       2

Embora isso possa ou não ser mais eficiente para um servidor processar, certamente é ilegível para uma pessoa normal que pode estar tentando mantê-lo e torna mais difícil para um desenvolvedor de aplicativos tentar acessá-lo. Então, minha verdadeira pergunta é quão longe é longe demais? Existem "práticas recomendadas" para esse tipo de coisa ou um bom conjunto de diretrizes em algum lugar? Não consigo encontrar nenhuma informação on-line que realmente estabeleça um conjunto de diretrizes bom e utilizável para esse problema específico que estou tendo. O design de banco de dados é antigo para mim, mas o BOM design de banco de dados é muito novo, portanto, respostas excessivamente técnicas podem estar além da minha cabeça. Qualquer ajuda seria apreciada!

relational-theory
  • 3 3 respostas
  • 22159 Views

3 respostas

  • Voted
  1. Best Answer
    Mike Sherrill 'Cat Recall'
    2011-12-13T03:51:34+08:002011-12-13T03:51:34+08:00

    Mas até que ponto posso continuar a dividir as informações em tabelas de pesquisa menores antes que elas se tornem incontroláveis? Eu poderia criar uma tabela de gênero e ter 1 correspondendo a masculino e 2 correspondendo a feminino em uma tabela de pesquisa separada.

    Você está misturando dois problemas diferentes. Um problema é o uso de uma tabela de "pesquisa"; o outro é o uso de chaves substitutas (números de identificação).

    Comece com esta tabela.

    ID  LName   FName   Gender  Position
    1   Doe     John    Male    Manager
    2   Doe     Jane    Female  Sales
    3   Smith   John    Male    Sales
    

    Você pode criar uma tabela de "pesquisa" para posições como esta.

    create table positions (
      pos_name varchar(10) primary key
    );
    
    insert into positions
    select distinct position 
    from employees;
    
    alter table employees
    add constraint emp_fk1
    foreign key (position) 
      references positions (pos_name);
    

    Sua tabela original parece exatamente como antes de criar a tabela "lookup". E a tabela de funcionários não requer junções adicionais para obter dados úteis e legíveis por humanos.

    O uso de uma tabela de "pesquisa" se resume a isso: seu aplicativo precisa do controle sobre os valores de entrada fornecidos por uma referência de chave estrangeira? Nesse caso, você sempre pode usar uma tabela de "pesquisa". (Independentemente de usar uma chave substituta.)

    Em alguns casos, você poderá preencher completamente essa tabela em tempo de design. Em outros casos, os usuários precisam ser capazes de adicionar linhas a essa tabela em tempo de execução. (E você provavelmente precisará incluir alguns processos administrativos para revisar novos dados.) Gênero, que na verdade tem um padrão ISO , pode ser totalmente preenchido no momento do design. Nomes de ruas para pedidos internacionais de produtos on-line provavelmente precisam ser adicionados em tempo de execução.

    • 22
  2. gbn
    2011-12-11T15:36:57+08:002011-12-11T15:36:57+08:00

    Em sua tabela Funcionários, eu teria apenas uma pesquisa para "Posição" porque é um conjunto limitado de dados que pode ser expandido.

    • O gênero é autodescritivo (digamos Mou F), limitado a 2 valores e pode ser aplicado com uma restrição CHECK. Você não adicionará novos gêneros (ignorando as besteiras do politicamente correto)
    • O primeiro nome "John" não faz parte de um conjunto limitado e restrito de dados: o conjunto potencial de dados é enorme a ponto de efetivamente ilimitado, portanto não deve ser uma pesquisa

    Se você quiser adicionar uma nova posição, basta adicionar uma linha à tabela de pesquisa. Isso também remove anomalias de modificação de dados, que é um ponto de normalização

    Além disso, uma vez que você tenha um milhão de funcionários, é mais eficiente armazenar tinyint PositionID do que varchar.

    Vamos adicionar uma nova coluna "moeda do salário". Eu usaria uma tabela de pesquisa aqui com uma chave de CHF, GBP, EUR, USD etc: eu não usaria uma chave substituta. Isso pode ser restringido com uma restrição CHECK como Gender, mas é um conjunto de dados limitado, mas expansível, como Position. Eu dou este exemplo porque eu usaria a chave natural mesmo que ela apareça em um milhão de linhas de dados de funcionários, apesar de ser char (3) em vez de tinyint

    Então, para resumir, você usa tabelas de pesquisa

    1. onde você tem um conjunto de dados finito, mas expansível em uma coluna
    2. onde está não é auto-descritivo
    3. para evitar anomalias de modificação de dados
    • 8
  3. kevinskio
    2011-12-10T19:53:58+08:002011-12-10T19:53:58+08:00

    A resposta é um "depende". Não é muito satisfatório, mas há muitas influências empurrando e puxando o design. Se você tiver programadores de aplicativos projetando o banco de dados, uma estrutura como a que você descreve funciona para eles porque o ORM oculta a complexidade. Você vai arrancar os cabelos ao escrever relatórios e terá que entrar em dez mesas para obter um endereço.

    Design para o uso, uso pretendido e uso futuro provável. É aqui que entra o seu conhecimento do processo de negócios. Se você estiver projetando um banco de dados para uma empresa veterinária, há suposições razoáveis ​​sobre tamanho, uso e direções na funcionalidade que serão bem diferentes de uma start-up de alta tecnologia.

    Para reutilizar uma citação favorita

    "Um homem sábio uma vez me disse "normalize até doer, desnormalize até funcionar".

    Em algum lugar lá está o ponto ideal. Minha experiência tem sido que ter um id de chave em mais de uma tabela não é um crime tão sério quanto alguns pensam se você nunca mudar as chaves primárias.

    Veja este exemplo abreviado de tabelas altamente normalizadas de um sistema real

    CREATE TABLE PROPERTY
    (ID                          NUMBER(9)           NOT NULL);
    
    CREATE TABLE PROPERTY_TYPE
    (ID                          NUMBER(9)           NOT NULL);
    
    CREATE TABLE PROPERTY_LOCALE 
    PROPERTY_ID                  NUMBER(9)           NOT NULL,
    (LOCALE_ID                   NUMBER(9)           NOT NULL,  --language 
    VALUE                        VARCHAR2(200)       NOT NULL);
    
    CREATE TABLE PROPERTY_DEPENDENCY
    (PROPERTY_ID                 NUMBER(9)           NOT NULL,
     PARENT_PROPERTY_ID          NUMBER(9)                   ,
     PROPERTY_TYPE_ID            NUMBER(9)           NOT NULL);
    

    Essas tabelas configuram uma lista vinculada de propriedades únicas e propriedades pai-filho e são usadas aqui

      CREATE TABLE CASE_PROPERTY
      (ID                        NUMBER(9)           NOT NULL,
      PARENT_ID                  NUMBER(9),
      CASE_ID                    NUMBER(9)           NOT NULL,
      PROPERTY_ID                NUMBER(9),
      PROPERTY_TYPE_ID           NUMBER(9)           NOT NULL);
    

    Isso parece bom: obtenha todos os casos com um property_id em uma seleção

    Vamos pegar uma lista para escolher

     Select pl.value, pd.property_id
     from property_locale pl, property_dependency pd
     where pl.property_id = pd.property_id
     and pd.property_type_id = 2;  --example number
    

    Agora tente selecionar todas as propriedades de um caso se ele tiver property_types de 3 e 4 e 5, ou não...

    SELECT   cp2.case_id,
             (SELECT   pl.VALUE
                FROM   case_property cp, property_locale pl
               WHERE       cp.property_id = pl.property_id
                       AND CP.PROPERTY_TYPE_ID = 2
                       AND pl.locale_id = 2
                       AND cp.case_id = cp2.case_id)
                AS VALUE1,
             (SELECT   pl.VALUE
                FROM   case_property cp, property_locale pl
               WHERE       cp.property_id = pl.property_id
                       AND CP.PROPERTY_TYPE_ID = 34
                       AND pl.locale_id = 2
                       AND cp.case_id = cp2.case_id)
                AS VALUE2,
             (SELECT   pl.VALUE
                FROM   case_property cp, property_locale pl
               WHERE       cp.property_id = pl.property_id
                       AND CP.PROPERTY_TYPE_ID = 4
                       AND pl.locale_id = 2
                       AND cp.case_id = cp2.case_id)
                AS VALUE3
      FROM   case_property cp2
     WHERE   cp2.case_id = 10293  
    

    Isso só dói... mesmo quando você usa formas mais elegantes de lidar com isso. No entanto, adicione um pouco de normalização quebrando as propriedades para as quais um caso terá apenas um property_id e isso pode ser muito melhor.

    Para descobrir quando você tem muitas tabelas ou não o suficiente, tente consultar o banco de dados com perguntas que o aplicativo usará, um relatório e uma análise ano a ano.

    • 5

relate perguntas

  • Como projetar relacionamentos para dados variantes?

  • De que escopo(s) "hasMany" faz parte?

  • Design Relacional - Várias tabelas em uma coluna de chave estrangeira?

  • Qual padrão devo seguir ao nomear tabelas e exibições?

  • Como estruturar um modelo para representar de forma adequada e eficiente dados em forma de árvore em bancos de dados relacionais?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve