AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 247067
Accepted
sanjihan
sanjihan
Asked: 2019-09-06 06:23:08 +0800 CST2019-09-06 06:23:08 +0800 CST 2019-09-06 06:23:08 +0800 CST

现代 RDBMS 中两个或多个逻辑关系/表的物理共集群

  • 772

优化搜索查询的一种可能方法是(a)将保留与不同关系/表对应的数据的记录存储在(b)相同文件→相同页面上。这样,可以更快地执行连接。

我用谷歌搜索了“共同聚类”,结果出人意料地很少。例如,我在 MySQL 上一无所获。有迹象表明甲骨文在 10 年前就提供了它。联合集群仍然是优化的有效选择吗?

例如,您有两个关系/表:

  • Employee (id, name, age, did)
  • Department (did, location)

您优化的典型查询可能如下所示:

SELECT E.name, 
       E.age 
  FROM Employee E, 
       Department D 
 WHERE E.age = 25 
   AND E.did = D.did;

如果您有 1,000,000 名员工并且他们都在 25 到 27 之间,那么最好的连接方法可能是排序合并连接或哈希连接 - 两者都需要多次扫描。

现在,如果您将多个关系/表的元组/行存储在同一页面上,您可以使用一种物理结构,将具有某个特定的部门与did具有相同的员工一起存储did。请注意,这种连接需要更少的 IO。

performance storage
  • 1 1 个回答
  • 92 Views

1 个回答

  • Voted
  1. Best Answer
    mustaccio
    2019-09-06T16:36:45+08:002019-09-06T16:36:45+08:00

    联合集群仍然是优化的有效选择吗?

    当然,如果您的 DBMS 提供它,它是一个有效的优化选项。正如 David Browne 在评论中提到的那样,只有 Oracle 这样做(在某种程度上,它告诉你这个特性有多实用)。

    正如您所指出的,它在非常有限的场景中很有用,但不利于更广泛的查询。在可能从表共集群中受益的情况下,您可以采用替代优化技术,例如物化(索引)视图或按列组织的表,它们提供类似的性能优势,同时更广泛可用。

    还要考虑到今天 SSD 存储的普遍使用、数据库服务器上大量廉价 RAM 以及更好的查询优化器,以可能的负面影响和额外的数据库维护开销为代价,降低了物理 I/O 边际减少的价值。

    TLDR:不要打扰。

    • 2

相关问题

  • 使用存储过程处理数据与在检索后将其输入函数相比是否有性能提升?

  • 您如何针对繁重的 InnoDB 工作负载调整 MySQL?

  • 如何确定是否需要或需要索引

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve