AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 325930
Accepted
Borisav Živanović
Borisav Živanović
Asked: 2023-04-13 03:32:49 +0800 CST2023-04-13 03:32:49 +0800 CST 2023-04-13 03:32:49 +0800 CST

聚集索引碎片是否发生在关系型 DBMS 中?

  • 772

是否有可能在某种随机插入和删除模式之后,叶数据节点因聚簇索引而变得碎片化?

也就是说,物理顺序不反映聚集索引强加的逻辑顺序(比如 INT 主键)?这样,范围查询即使在找到间隔开始后也需要随机 I/O。

大多数大学课程(例如 Andy Pavlo 的 CMU 数据库系统简介)都说数​​据是根据密钥进行物理排序的。虽然绝对接近现实,但在我看来,计算所需的频繁文件碎片整理的成本是不现实的。

clustered-index
  • 2 2 个回答
  • 46 Views

2 个回答

  • Voted
  1. Best Answer
    Jonathan Fite
    2023-04-13T03:42:54+08:002023-04-13T03:42:54+08:00

    是的

    您可以在自然键或非线性插入的键上创建聚簇索引。例如,使用电子邮件地址、社会安全号码等。在很多情况下,这些都是“足够好”的自然键。或者让数据以不同于 ID 值的物理方式存储更有意义。我认为它们仍然不应该是聚集键,但它确实有意义,并且是聚集索引可能变得碎片化的一种方式。

    所以你可能会在那里变得支离破碎,因为一个新的插入可能是无序的,并且当它属于中间时被写入树的末尾。

    如果您有删除,您还可以从更典型的表设计中获得碎片。场景是您有一个典型的表,其中包含一个自动递增的 ID 字段。大多数时候这是最佳实践选择。您在该 ID 字段上创建聚集索引。如果您所做的只是插入,这很好。所有新记录都在树的末尾,并按 ID 字段排序。

    但是假设您删除了记录……那么现在您有碎片,因为数据页未满。或者以前的空白页面不再连续。

    补充说明;您还可以通过更新记录来获得碎片。如果您有一个创建为空的列,但具有最多 100 个字符的可变宽度。当您返回并将其从 NULL 更新为一个值时,这可能会将该行的部分内容推到另一个页面上......这也会导致碎片化。

    • 4
  2. Rick James
    2023-04-13T11:30:02+08:002023-04-13T11:30:02+08:00

    磁盘布局取决于供应商。

    下面是关于 MySQL/MariaDB 中 InnoDB 引擎的一些具体信息。(注意:其他供应商不一定遵循相同的设计。)

    • 总有一个主键。
    • PK 始终是群集的,并且始终是UNIQUE.
    • 数据按PK排序,以16KB的块存储在B+树中。
    • 正如 Jonathan 所说,插入、删除甚至更新都可能与块中的 is 混淆。
    • 如果一个块中放入了太多数据,则会将其拆分为 2 个块。
    • 当两个逻辑上相邻的块几乎变空时,会尝试将它们组合起来。
    • 我在 3 次中只使用了大约 1 次 Auto_Increment ID。
    • 用于链接表的多对多映射表的最佳索引A是B。PRIMARY KEY(a_id, b_id), INDEX(b_id, a_id)请注意,向该表添加 ID 会降低性能。
    • BTree 确实会碎片化,但这不值得担心。它倾向于平均块满度约为 69%。
    • 与许多其他供应商不同,InnoDB 没有“行号”。
    • 0

相关问题

  • 使用 update 语句更新包含的列时,非聚集索引会发生什么情况?

  • 聚集索引总是比非聚集索引好?

  • 堆上的非聚集索引与聚集索引的性能

  • 使用 SSD 时,数据库设计中聚集索引的概念是否有意义?

  • 什么是聚集索引?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve