AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 461
Accepted
Gabriel Solomon
Gabriel Solomon
Asked: 2011-01-11 01:30:20 +0800 CST2011-01-11 01:30:20 +0800 CST 2011-01-11 01:30:20 +0800 CST

重复列以加快查询速度?

  • 772

标题没有太大意义,但我想不出更好的标题来解决这个问题。

我有以下表格

项目

  • ID
  • 姓名

顾客

  • ID
  • id_project
  • 姓名

付款

  • ID
  • id_customer
  • 日期
  • 和

当用户进入系统时,他将有权访问某个项目。现在,我想列出该项目的所有付款,这应该很容易:

SELECT FROM payments where id_customer in (SELECT id from customers where id_project = 5)

我的问题是:如果以这种方式将列 id_project 添加到支付表中不是更好,那么查询将更容易和更快。

database-design normalization
  • 3 3 个回答
  • 9622 Views

3 个回答

  • Voted
  1. Best Answer
    Jeff Atwood
    2011-01-11T01:57:39+08:002011-01-11T01:57:39+08:00

    您似乎在问非规范化是否有意义。

    非规范化是尝试通过添加冗余数据或对数据进行分组来优化数据库读取性能的过程。在某些情况下,非规范化有助于掩盖关系数据库软件固有的低效率。关系规范化数据库对数据的物理存储施加了沉重的访问负载,即使它已针对高性能进行了很好的调整。

    答案总是“视情况而定”,所以这是我的经验法则:

    如果 ...

    • 数据量不大
    • 你还没有做大量的连接
    • 和/或数据库性能目前不是瓶颈

    然后保持正常化。是的,非规范化更快,但这也意味着系统中有冗余数据——必须维护并保持同步的数据。该数据不再有“一个来源”,而是可以偏离的多个来源。随着时间的推移,这是有风险的,所以你不应该这样做,除非你有很好的理由这样做,并得到一些基准的支持。

    我只会在......

    • 数据量非常大
    • 连接很昂贵,您必须执行很多操作才能返回微不足道的查询
    • 数据库性能是一个瓶颈和/或你想尽可能快

    连接在现代硬件上非常快,但它们从来都不是免费的。

    • 64
  2. David Spillett
    2011-01-11T02:33:33+08:002011-01-11T02:33:33+08:00

    您最好将查询重写为:

    SELECT payments.*
    FROM   customers
    JOIN   payments 
    ON     payments.id_customer = customers.id
    WHERE  customers.id_project = 5
    

    虽然这看起来不那么简洁,一个好的查询规划器会看到你正在尝试做的事情并运行你的相关子查询作为上面的连接,一个糟糕的查询规划器最终可能会进行索引扫描payments.id_customer(假设你有一个相关的索引)(或更糟糕的是,表格扫描)而不是以更有效的方式做事。如果这个查询的安排包含在更复杂的东西中,即使是一个好的查询计划器也可能看不到优化。将关系表达为连接而不是子查询可能比更改数据结构产生更大的不同。

    正如 Jeff 所说,任何非规范化都应该谨慎考虑——它可以带来简单的性能提升,特别是对于某些报告目的,但可能由于支持业务逻辑中的错误而导致不一致。

    作为旁注:显然我不了解您的业务,所以我可能会遗漏一些东西,但是您的餐桌关系对我来说似乎很奇怪。他们暗示你永远不能与同一个客户拥有一个以上的项目,这在我的经验中通常是不正确的,至少在很长一段时间内是这样。

    customer     project      payment
    --------     --------     -------
                              pa_id
                 pr_id    <-- payment
    cu_id    <-- customer     
    

    或者如果标准化程度较低(尽管我怀疑这是必要的):

    customer     project      payment
    --------     --------     --------
                              pa_id
                 pr_id    <-- payment
    cu_id    <-- customer 
               `------------- customer    
    

    当然,这仍然会降低与两个客户合作项目的可能性……

    • 10
  3. Christof Prettner
    2011-01-13T23:05:32+08:002011-01-13T23:05:32+08:00

    在某些数据库中,您可以基于复杂查询创建“物化视图”而不是具有大量数据的复杂视图。这可用于避免历史增长的应用程序系统中的非规范化。如果您决定使用“物化视图”您必须清楚地了解刷新方法和物化视图将使用的存储量......

    • 6

相关问题

  • 存储计算值或根据要求重新计算它们更好吗?[复制]

  • 存储与计算聚合值

  • 在数据仓库中实现多对多关系有哪些方法?

  • 高级规范化形式是否总是符合低级规范化形式的标准?

  • 标准化练习资源

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    您如何显示在 Oracle 数据库上执行的 SQL?

    • 2 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    我可以查看在 SQL Server 数据库上运行的历史查询吗?

    • 6 个回答
  • Marko Smith

    如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id?

    • 10 个回答
  • Marko Smith

    如何在 Mac OS X 上运行 psql?

    • 11 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Marko Smith

    将数组参数传递给存储过程

    • 12 个回答
  • Martin Hope
    Manuel Leduc PostgreSQL 多列唯一约束和 NULL 值 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler 什么时候应该将主键声明为非聚集的? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - 哪个更好作为主键? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick 如何优化大型数据库的 mysqldump? 2011-01-04 13:13:48 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve