SQL Server - 使用聚集索引时如何存储数据页

Question

user262197

Asked: 2022-10-13 19:20:36 +0800 CST2022-10-13 19:20:36 +0800 CST 2022-10-13 19:20:36 +0800 CST

解决周期性高 PAGELATCH_EX 等待。最后一页争用？

772

PAGELATCH_EX由于大量插入而导致的等待问题确实需要一些帮助。我们看到一个简单的插入到表的等待中PAGELATCH_EX和等待中的随机峰值。_SH

每天只发生几次，但当出现短暂的锁定和等待时间增加时，可能会导致我们的 Web 应用程序排队。服务器超出了规范，SSD 磁盘似乎没有接近 I/O 容量。

我读PAGELATCH_EX的是由于表中的顺序聚集主键以及最后一页争用，所以我已将聚集索引更改为 GUID，并将原始顺序 ID 更改为非聚集索引，因为我们仍然需要基于此查询ID。

不幸的是，它看起来并没有解决问题。我还尝试在索引上设置 70% 的填充因子。顺序非聚集索引还会导致PAGELATCH_EX？我们是否也需要将非唯一数字作为该索引的一部分？

这是带有 GUID 和所有索引的新表：

CREATE TABLE [dbo].[data_202210](
    [Id] [uniqueidentifier] NOT NULL,
    [sequentialnumber] [bigint] NOT NULL,
    [w1] [bigint] NOT NULL,
    [h1] [bigint] NOT NULL,
    [datetime] [datetime] NOT NULL,
    [p1] [bigint] NOT NULL,
    [memberid] [bigint] NULL,
    [datatype] [int] NOT NULL,
    [datavalueid] [bigint] NOT NULL,
    [categoryid] [bigint] NULL,
    [categorytype] [int] NULL,
    [orderid] [bigint] NULL,
    [ordertotal] [decimal](10, 2) NULL,
    [url] [nvarchar](2048) NULL,
    [img] [nvarchar](2048) NULL,
 CONSTRAINT [PK_data_Id_202210] PRIMARY KEY CLUSTERED 
(
    [Id] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]
GO

ALTER TABLE [dbo].[data_202210] ADD  DEFAULT (newid()) FOR [Id]
GO

ALTER TABLE [dbo].[data_202210]  WITH CHECK ADD  CONSTRAINT [CC_data_202210_Id_datetime] CHECK  (([datetime]>='2022-10-01' AND [datetime]<'2022-11-01'))
GO

ALTER TABLE [dbo].[data_202210] CHECK CONSTRAINT [CC_data_202210_Id_datetime]
GO

--this is the old clustered index which is sequentially created number in our application
--still used in a queries to join to another table
CREATE NONCLUSTERED INDEX [pigdataid_202210] ON [dbo].[data_202210]
(
    [sequentialnumber] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 70) ON [PRIMARY]
GO

-- covering indexes for querying the data
CREATE NONCLUSTERED INDEX [lookup_202210] ON [dbo].[data_202210]
(
    [w1] ASC,
    [p1] ASC,
    [datetime] ASC,
    [datatype] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
GO

CREATE NONCLUSTERED INDEX [trending_lookup_202210] ON [dbo].[data_202210]
(
    [w1] ASC,
    [datatype] ASC,
    [datetime] ASC
)
INCLUDE ([datavalueid]) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 70) ON [PRIMARY]
GO

我使用各种查询来查看等待以及 RedGate SQL Monitor。

服务器是 16 个 CPU 和 128GB RAM。磁盘为 10,000 IOPS，500 MB/s 吞吐量。峰值时每秒大约 400 次插入。我不会认为 400 很多，但等待肯定指向PAGELATCH_EXand PAGELATCH_SH。插入大约需要 1 毫秒。其他等待还可以。

不幸的是，我们无法迁移到 SQL Server 2019。

2 个回答

Voted

Tibor Karaszi · Answer 1 · 2022-10-14T00:58:29+08:00

您仍然在顺序增加的键上有一个索引，您只是将它从聚集索引更改为非聚集索引。它仍然是一个 B 树。不过，由于新的“递增”索引更窄，争用可能已经减少。

Fillfactor < 100 无济于事，因为最后一页会立即填满。即，填充因子仅在您创建索引时才相关。通过指定一个 < 100 的值，您所做的只是使索引更大。

您要确保您的问题在不断增加的索引上（作为集群或非集群）。这篇文章末尾的文章有一个查询，可让您确定这一点。仅仅看到 PAGELATCH_* 的累积等待还不足以确定这一点。

如果可能，请使用 SQL Server 2019 进行测试。对于这种情况，它有一个索引选项：OPTIMIZE_FOR_SEQUENTIAL_KEY. 它将改变调度，以便更有可能在一个量子（4 ms）内完成的线程将在队列中获得优先级，从而减少昂贵的上下文切换。它可能不会减少累积的等待，但可能会增加吞吐量（这最终是您想要的）。见这篇文章。

这篇 MS 文章讨论了您的问题情况，并有一个查询以确定这是否是您的实际问题，以及改善情况的可能方法；包括上面提到的指数期权。如果您仍然需要顺序值的索引并且如果该索引是争用的位置，则您无能为力，但上述索引选项除外，但它再次需要 SQL Server 2019。https://learn.microsoft.com /en-us/troubleshoot/sql/performance/resolve-pagelatch-ex-contention

user262197 · Answer 2 · 2022-10-18T18:57:12+08:00

在 SQL Server 中使用 Resolve last-page insert PAGELATCH_EX contention 中的主文件组上的分区实现方法 6将我们的插入总持续时间性能从 1 毫秒提高到 0.1 毫秒。

PAGELATCH_EX或不再有尖峰_SH。会推荐给运行 SQL 2016 SP1 或 2017 的任何人。

方法 6：使用表分区和带有哈希值的计算列

使用表分区和具有哈希值的计算列来分散 INSERT 操作。由于此方法使用表分区，因此只能在 SQL Server 企业版上使用。

ℹ 注意

您可以在 SQL Server 2016 SP1 标准版中使用分区表。有关详细信息，请参阅SQL Server 2016 的版本和支持的功能一文中对“表和索引分区”的描述。

还发现Erik Darling的 Last Page Contention Solutions For SQL Server 的优点和缺点非常有帮助。

解决周期性高 PAGELATCH_EX 等待。最后一页争用？

方法 6：使用表分区和带有哈希值的计算列

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

解决周期性高 PAGELATCH_EX 等待。最后一页争用？

2 个回答

方法 6：使用表分区和带有哈希值的计算列

相关问题