死锁的主要原因是什么，可以预防吗？

Question

LCJ

Asked: 2016-09-10 07:23:08 +0800 CST2016-09-10 07:23:08 +0800 CST 2016-09-10 07:23:08 +0800 CST

随机顺序列上的聚簇索引

772

我的系统中有一个名为“Orders”的现有表。OrderID 是该表中的主键——它是一个聚集索引。我为“OrderCompanyDetails”设计了一个新表，如下所示。1-to-1 它与订单表有关系。在新表中，OrderID 保留为聚簇主键。

只有当订单被批准时，数据才会被插入到新表中。所以插入到新表中的 OrderID 可能不按顺序。OrderID 10 可能会在 OrderID 5 之前插入，具体取决于首先批准的订单。

在 OrderID 上使用聚簇索引有助于我的查询。但是聚集索引位于以随机序列获取数据的列上。这是一个糟糕的索引设计吗？如果是，我是否应该添加一个名为 OrderCompanyDetailID 的新无意义标识列并将其作为聚集索引？

CREATE TABLE [dbo].[Orders]
(
    [OrderID] [int] IDENTITY(1,1) NOT NULL,
    [OrderType] [char](3) NOT NULL,
    [StatusCD] [char](10) NOT NULL,
    [CreatedOnDate] [datetime] NOT NULL CONSTRAINT [DF__Orders__CreatedOn]  DEFAULT (getdate()),
    CONSTRAINT [PK_Orders] PRIMARY KEY CLUSTERED 
    (
        [OrderID] ASC
    )
)

CREATE TABLE [dbo].[OrderCompanyDetails](
    [OrderID] [int] NOT NULL,
    [POCompanyCD] [char](4) NULL,
    [VendorNo] [varchar](9) NULL,
    [CreatedOnDate] [datetime] NOT NULL CONSTRAINT [DF_OrderCompanyDetails_CreatedOn]  DEFAULT (getdate()),
    CONSTRAINT [PK_OrderCompanyDetails] PRIMARY KEY CLUSTERED 
    (
        [OrderID] ASC
    )
)

更新

最近阅读文章Ever-increasing clustering key – the Clustered Index Debate………….again！. 里面有评论

请记住——狭窄的、静态的、独特的、不断增加的——而且通常是代理键而不是自然键。

3 个回答

Voted

Tara Kizer · Answer 1 · 2016-09-10T07:49:56+08:00

Tara Kizer

2016-09-10T07:49:56+08:002016-09-10T07:49:56+08:00

聚簇索引的建议是它们不断增加或不断减少，但这并不意味着它们必须如此。GUID 不会增加或减少，除非您使用顺序 GUID。大多数人不使用顺序 GUID。

如果您担心页面拆分会影响性能，请在需要页面拆分之前降低填充因子以容纳更多插入。如果 GUID 是聚簇索引，这也是 GUID 的建议（我不是说它应该是聚簇索引，我是说如果是的话）。请注意将它降低到多低，因为它会影响读取性能，这对您来说可能很重要，因为您提到 OrderID 上的聚集索引有助于您的查询。

5

Thomas Cleberg · Answer 2 · 2016-09-10T07:51:47+08:00

Thomas Cleberg

2016-09-10T07:51:47+08:002016-09-10T07:51:47+08:00

答案是不一定。

索引的作用是插入后辅助查询表，你说这个索引就是干这个的。这种改进的成本是

索引在插入时有额外的开销成本——也就是说，新记录必须根据聚簇索引值在现有记录中排序。
维护索引和相关统计数据，以确保改进在初始实施后继续进行。这可能包括定期重建统计信息和/或索引。

如果维护和/或插入开销的成本大于在其操作的上下文中使用表进行选择所带来的性能增益带来的好处，则应重新考虑索引。

4

LCJ · Answer 3 · 2016-09-15T05:02:26+08:00

感谢您的回答。由于以下原因，我决定在我的表中添加一个代理键（作为标识列）

我的使用场景是表有很多insert。
代理键有助于保持聚集索引不断增加的顺序。
不断增加的顺序对于避免碎片化和页面拆分很重要，如不断增加的聚簇键 - 聚簇索引辩论............再次说明！

如果插入太重（并发），ever increasing order则会产生PAGELATCH_EX等待问题。阅读PAGELATCH_EX waits and heavy inserts，其中提到了hash partitioning with a computed columnBit Reversion

注意：Insert Hot Spot如果工作负载涉及将数百个并发线程插入到表中，则会出现问题。

另请阅读膝跳等待统计：PAGELATCH - Paul RandalInsert Hotspot，其中说明如下：

当有人试图通过将随机 GUID 簇键更改为 int 或 bigint 身份簇键来消除索引碎片问题，但未能在生产负载下测试新表架构时，我已经看到像这样的插入热点突然出现。

Latch wait可以使用Advanced SQL Server performance tuning - Paul Randal中提到的DMV来分析，其中使用了sys.dm_os_waiting_tasks。另请参阅更新的 sys.dm_os_waiting_tasks 脚本

PAGELATCH_EX - sqlskills将Insert Hot Spot和Page Split作为 PAGELATCH_EX 的三个可能原因中的两个。

随机顺序列上的聚簇索引

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

随机顺序列上的聚簇索引

3 个回答

相关问题