AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 6836
Accepted
Gabe
Gabe
Asked: 2011-10-15 13:53:28 +0800 CST2011-10-15 13:53:28 +0800 CST 2011-10-15 13:53:28 +0800 CST

Melhor maneira de projetar esta tabela de quilometragem?

  • 772

Estarei preenchendo uma tabela de milhas por galão (MPG). Está vindo de uma fonte de hodômetro.

Atualmente está configurado da seguinte forma:

  id               (primary_key)
, truck_num
, start_date
, end_date
, start_miles
, end_miles
, start_fuel
, end_fuel
, miles
, gals
, mpg

Parece haver alguma redundância. O milesé (end_miles - start_miles), idem para gals.

Devemos ter essas colunas pré-calculadas e armazenadas no banco de dados miles? galsIsso definitivamente tornaria a consulta mais fácil, mas à custa de espaço. Mesma pergunta para ter o mpgcalculado. Uma coluna computada tornaria as coisas mais lentas, não?

Quais índices funcionariam melhor? São cerca de 3.000 caminhões (registros) inseridos em um lote toda semana.

Estou usando o SQL Server 2008 R2.

Editar: uma consulta de amostra que eu usaria

-- find average mpg for since ytd
select m.truck_num, avg(mpg)
from mpg m
join truck t on t.truck_num = m.truck_num
where start_date >= @begin_of_year and end_date <= @today
group by truck_num
sql-server-2008 database-design
  • 2 2 respostas
  • 1596 Views

2 respostas

  • Voted
  1. Best Answer
    Nick Chammas
    2011-10-16T10:10:19+08:002011-10-16T10:10:19+08:00
    • As colunas computadas são suas amigas. Use-os para capturar cálculos simples que você fará de qualquer maneira e para garantir que os valores calculados estejam corretos.
    • Persista os resultados se desejar indexá-los ou filtrá-los; não os persista se você só precisa puxar o valor de vez em quando.
    • Capture todas as restrições de dados usando CHECKrestrições.

    Aqui está uma definição de pseudo-esquema:

      id               PRIMARY KEY
    , truck_num
    
    , start_date
    , end_date         CHECK (end_date > start_date)
    
    , start_miles      CHECK (start_miles >= 0)
    , end_miles        CHECK (end_miles > start_miles)
    
                       -- what if they refill the tank?
    , start_gals       CHECK (start_gals >= 0)
    , end_gals         CHECK (end_gals < start_gals AND end_gals >= 0)
    
    -- all these should be computed
    , miles = end_miles - start_miles
    , gals = start_gals - end_gals
    , mpg = miles/gals
    

    Quanto à indexação da tabela, eis o que penso:

    • Cluster em start_date ASC. Isso satisfará sua WHEREcláusula. Você está sempre inserindo dados aumentando start_date, o que significa que suas gravações sempre serão sequenciais nesse esquema de agrupamento. Você também está sempre consultando start_datepara satisfazer seu maior padrão de consulta. (3.000 inserções por semana não é nada. Como você tem um volume tão baixo de inserções, pode até agrupar em start_date ASC, end_date ASC.)
    • Crie um índice não clusterizado em truck_nume INCLUDE mpg. Isso deve satisfazer suas cláusulas SELECT, JOINe . GROUP BYSe você quiser ORDER BY mpg, faça mpgparte da chave de índice depois truck_num, em vez de apenas INCLUDEapertá-la.

    Quando terminar, teste sua configuração da seguinte maneira:

    1. Criar uma tabela de teste
    2. Bombeie-o cheio de dados de teste
    3. Crie os índices
    4. Atualizar estatísticas
    5. Execute suas consultas mais comuns
    6. Verifique seus planos e tempos de execução
    • 7
  2. gbn
    2011-10-17T06:43:04+08:002011-10-17T06:43:04+08:00

    Eu gosto da resposta de Nick, então não vou repetir suas informações sobre colunas computadas e restrições.

    Eu abordaria a indexação de maneira diferente:

    • Se todos os índices NC puderem ser cobertos, a escolha do índice clusterizado não importa, portanto, um substituto seria aceitável.
    • Isso só importa em volumes maiores/bancos de dados grandes e se os padrões de consulta exigirem mais índices NC.
    • Um índice agrupado na cobertura de qualquer maneira ... portanto, a partir disso, um índice (startdate, enddate, trucknum)deve ser exclusivo (o mesmo caminhão não pode fazer uma jornada idêntica). Então faça isso agrupado e único: um PK clássico usando a chave natural
    • 3

relate perguntas

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Quais são algumas maneiras de implementar um relacionamento muitos-para-muitos em um data warehouse?

  • Quanto "Padding" coloco em meus índices?

  • Existe um processo do tipo "práticas recomendadas" para os desenvolvedores seguirem para alterações no banco de dados?

  • Downgrade do SQL Server 2008 para 2005

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve