AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 12913
Accepted
JNK
JNK
Asked: 2011-03-30 04:42:59 +0800 CST2011-03-30 04:42:59 +0800 CST 2011-03-30 04:42:59 +0800 CST

SQL Server 2008 - 分区和聚集索引

  • 772

因此,让我先说我无法完全控制我的数据库设计,因此当前系统的许多方面都无法针对这种情况进行更改。

关于我们应该如何重新考虑设计方面的评论可能是正确的,但没有帮助:)

我有一个非常大的表,大约 150 个字段宽和大约 600m 行,它驱动大量进程。这是在数据仓库的情况下,所以我们在计划的加载过程之外没有任何更新/插入,所以它被大量索引。

已决定尝试对该表进行分区,并且我对索引分区表有些担心。我没有任何分区经验,因此感谢任何输入或链接。我无法在 BOL 或 msdn 上找到我所追求的具体内容。

目前,我们聚集在一个我们称之为IncidentKeyavarchar(50)且不是唯一的字段上 - 我们可以有 1-100 条相同的记录IK(请不要发表评论)。我们确实经常在旧IncidentKey记录上获得新数据,因此它也不是连续的。

我知道我需要IncidentDate在我的聚集索引键中包含我的分区字段 , 才能使分区正常工作。我想它会是IncidentKey, IncidentDate。

问题是,如果“新”分区中的记录应该在聚集索引中“旧”分区中的记录之前,那么聚集索引的机制将如何在分区表中的 2 部分键上工作?

例如,我有 5 条记录:

IncidentKey    Date

ABC123        1/1/2010
ABC123        7/1/2010
ABC123        1/1/2011
XYZ999        1/1/2010
XYZ999        7/1/2010

如果我得到一条新记录,ABC123, 2/1/2011它将需要在聚集索引BEFORE XYZ999, 1/1/2010中。这是如何运作的?

我假设有碎片和指针,但我找不到任何关于具有双部分键的分区表上的非分区聚集索引的物理存储和配置的信息。

sql-server index
  • 2 2 个回答
  • 9265 Views

2 个回答

  • Voted
  1. Best Answer
    Remus Rusanu
    2011-03-30T15:58:14+08:002011-03-30T15:58:14+08:00

    分区表实际上更像是拼接在一起的单个表的集合。因此,您在 clustering byIncidentKey和 partition by的示例中IncidentDate,假设分区函数将表拆分为两个分区,因此 1/1/2010 位于分区 1 中,而 7/1/2010 位于分区 2 中。数据将在磁盘上布置为:

    Partition 1:
    IncidentKey    Date
    ABC123        1/1/2010
    ABC123        1/1/2011
    XYZ999        1/1/2010
    
    Partition 2:
    IncidentKey    Date
    ABC123        7/1/2010
    XYZ999        7/1/2010
    

    在低级别确实有两个不同的行集。是一个查询处理器,它通过创建将所有行集作为一个整体来查找、扫描和更新所有行集的计划,从而产生单个表的错觉。

    任何非聚集索引中的任何行都将具有与其对应的聚集索引键,例如ABC123,7/1/2010. 由于聚集索引键始终包含分区键列,因此引擎将始终知道在聚集索引的哪个分区(行集)中搜索该值(在本例中为分区 2)。

    现在,每当您处理分区时,您必须考虑您的 NC 索引是对齐的(NC 索引的分区与聚集索引完全相同)还是非对齐的(NC 索引是非分区的,或者分区与聚集索引不同) . 非对齐索引更灵活,但它们也有一些缺点:

    • 对于某些查询计划,非对齐索引需要大量内存
    • 非对齐索引阻止高效的分区切换操作

    使用对齐索引解决了这些问题,但也带来了一系列问题,因为这种物理存储设计选项会影响数据模型:

    • 对齐索引意味着无法再创建/强制执行唯一约束(分区列除外)
    • 引用分区表的所有外键都必须在关系中包含分区键(因为分区键由于对齐而存在于每个索引中),这反过来又要求引用分区表的所有表都包含分区键列值。想想Orders->OrderDetails,如果Orders有OrderID但被OrderDate分区,那么OrderDetails不仅要包含OrderID,还要包含OrderDate,才能正确声明外键约束。

    我发现这些影响很少在部署分区的项目开始时被调用,但它们确实存在并且会产生严重的后果。

    如果您认为对齐索引是一种罕见或极端的情况,请考虑这一点:在许多情况下,ETL 和分区解决方案的基石是临时表的快速切换。切换操作需要对齐的索引。

    哦,还有一件事:我关于外键和将分区列值添加到其他表的连锁反应的所有论点同样适用于joins。

    • 19
  2. Mitch Wheat
    2011-03-30T04:50:52+08:002011-03-30T04:50:52+08:00

    当聚集索引有多个分区时,每个分区都有一个 B 树结构,其中包含该特定分区的数据。例如,如果一个聚集索引有四个分区,那么就有四个 B-tree 结构;每个分区一个。参考。聚集索引结构

    分区索引的特殊指南

    您可以重建分区索引的特定分区。

    例如

    ALTER INDEX IX_TransactionHistory_TransactionDate
    ON Production.TransactionHistory
    REBUILD Partition = 5;
    GO
    
    • 9

相关问题

  • 死锁的主要原因是什么,可以预防吗?

  • 我在索引上放了多少“填充”?

  • 如何确定是否需要或需要索引

  • RDBMS 上的“索引”是什么意思?[关闭]

  • 如何在 MySQL 中创建条件索引?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    您如何显示在 Oracle 数据库上执行的 SQL?

    • 2 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    我可以查看在 SQL Server 数据库上运行的历史查询吗?

    • 6 个回答
  • Marko Smith

    如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id?

    • 10 个回答
  • Marko Smith

    如何在 Mac OS X 上运行 psql?

    • 11 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Marko Smith

    将数组参数传递给存储过程

    • 12 个回答
  • Martin Hope
    Manuel Leduc PostgreSQL 多列唯一约束和 NULL 值 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler 什么时候应该将主键声明为非聚集的? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - 哪个更好作为主键? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick 如何优化大型数据库的 mysqldump? 2011-01-04 13:13:48 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve