AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 10689
Accepted
Michael McGowan
Michael McGowan
Asked: 2012-01-15 10:56:20 +0800 CST2012-01-15 10:56:20 +0800 CST 2012-01-15 10:56:20 +0800 CST

分开表或分割一张大表?

  • 772

我正在构建一个包含特定列的相当大的表,my_column. 有少量可能的值my_column,并且每个唯一值都my_column应该有相同数量的与之关联的行。此外,查询很可能一次只关注一个特定的值my_column。我看到一种选择是根据my_column. 我看到的另一种选择是完全创建一个单独的表,以便每个表都与my_column. 我想知道是什么导致我选择一个选项而不是另一个选项。

据我了解,一个分区的大表似乎是“正确”或“纯粹”的方式,因为这似乎是分区的主要用例。但是,我怀疑出于实际原因,第二种选择更好,这就是我所倾向于的。我不知道这是否重要,但我正在处理 MyISAM 表。

mysql database-design
  • 2 2 个回答
  • 4283 Views

2 个回答

  • Voted
  1. Best Answer
    RolandoMySQLDBA
    2012-01-15T22:02:17+08:002012-01-15T22:02:17+08:00

    我对你的第二个选项有一个建议。

    如果您需要将具有每个唯一my_column值的 MyISAM 表与其他 MyISAM 表分开,您可能需要查看MERGE (Mrg_MyISAM) 存储引擎作为表分区的替代方案。

    这将允许将同一数据库中具有相同表结构和索引布局的多个 MyISAM 表映射在一起,从而使单个查询命中所有 MyISAM 表。

    假设您有一个如下表:

    CREATE TABLE tb1
    (
        my_column INT NOT NULL
        id INT NOT NULL AUTO_INCREMENT,
        name VARCHAR(30),
        PRIMARY KEY (my_column,id),
        KEY name (my_column,name)
    ) ENGINE=MyISAM;
    

    你有 3 个这样的表(tb1、tb2、tb3),其中

    • tb1 的 my_column = 1
    • tb2 的 my_column = 2
    • tb3 的 my_column = 3

    您可以将它们合并到单个表映射下,如下所示:

    CREATE TABLE tbmerge LIKE tb1;
    ALTER TABLE tbmerge ENGINE=Mrg_MyISAM UNION=(tb1,tb2,tb3);
    

    要对所有表执行搜索,只需使用 tbmerge。例如,假设您想查看 tb2 中以“Jack”开头的每个名称,您可以运行以下查询:

    SELECT name FROM tbmerge WHERE my_column=2 AND name LIKE 'Jack%';
    

    鉴于表的设计,您应该始终指定 my_column 的值。事实上,对于 tb1 的每个索引,确保 my_column 始终是第一列。原因?针对 tbmerge 的查询始终是针对 tb1、tb2、tb3(所有基础表)的查询。否则,此查询

    SELECT name FROM tbmerge WHERE name LIKE 'Jack%';
    

    将遇到可怕的性能,因为它将对所有基础表执行表扫描。请按照这个简单的规则仔细计划您将使用的索引(使用 my_column 作为每个索引的第一列)

    还有一个额外的好处:您可以在方便时插入基础表,从而使用

    我在之前的一篇文章(2012 年 1 月 4 日)中使用 MERGE 表讨论了这个问题。

    • 1
  2. Mike Lue
    2012-01-16T19:59:36+08:002012-01-16T19:59:36+08:00

    如果系统中的大多数查询:

    1. 专注于单一价值(如您所述)。
    2. 对于该值中的总行数,预期行数至少为 50%(详见下文)。

    比方说,以下查询适合修改为分区:

    SELECT *
    FROM single_table
    WHERE my_column = $dedicated_value$
    

    如果您的查询有其他条件使得结果只是该值中总行数的微不足道的一部分,那么分区并不比单个表好得多。如下示例(假设参与列上有复合索引):

    SELECT *
    FROM single_table
    WHERE my_column = $dedicated_value$
        AND some_other_column = $another_dedicated_value$
    

    预期行的百分比

    用于评估策略的百分比取决于“my_column”中有多少不同的值以及原始单个表的行大小。

    您拥有的不同值越少,应考虑的预期行百分比就越少。您拥有的行大小越大,应考虑的预期行的百分比就越少。

    最好设计一些实验来反映您的估计。

    • 0

相关问题

  • 是否有任何 MySQL 基准测试工具?[关闭]

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何查看 Oracle 中的数据库列表?

    • 8 个回答
  • Marko Smith

    mysql innodb_buffer_pool_size 应该有多大?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    从 .frm 和 .ibd 文件恢复表?

    • 10 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve