SQL Server - 使用聚集索引时如何存储数据页

Question

Asked: 2024-05-14 16:09:54 +0800 CST2024-05-14 16:09:54 +0800 CST 2024-05-14 16:09:54 +0800 CST

索引查找和谓词下推

772

我有以下形式的查询：

IF EXISTS (
    SELECT    1
    FROM    (
                SELECT    RowID, OETID
                FROM    @InMemoryTableTypeTable i
                UNION
                SELECT    RowID, OETID
                FROM    @InMemoryTableTypeTable d
            ) AS t               
    WHERE    NOT EXISTS (
                SELECT    1
                FROM    dbo.MyTable m WITH(FORCESEEK, ROWLOCK, UPDLOCK)
                WHERE    (m.OETID = t.RowID)
                        AND (m.SRID = t.OETID)
                        AND (m.WTID = @WTID)
                        AND (m.Status <> 1)
                        AND (m.SRID > 0)
            )
)
...

的定义dbo.MyTable是：

CREATE TABLE [dbo].[MyTable](
    [ID] [bigint] IDENTITY(1,1) NOT NULL,
    [RowGUID] [uniqueidentifier] ROWGUIDCOL  NOT NULL,
    [WTID] [bigint] NOT NULL,
    [OETID] [int] NOT NULL,
    [SRID] [bigint] NOT NULL,
    [Status] [tinyint] NOT NULL,
 CONSTRAINT [PK_MyTable] PRIMARY KEY CLUSTERED 
(
    [ID] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, OPTIMIZE_FOR_SEQUENTIAL_KEY = OFF) ON [PRIMARY]
) ON [PRIMARY]
GO

CREATE UNIQUE NONCLUSTERED INDEX [IDX] ON [dbo].[MyTable]
(
    [WTID] ASC,
    [OETID] ASC,
    [SRID] ASC
)
INCLUDE([Status]) 
WHERE ([SRID]>(0))
WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, OPTIMIZE_FOR_SEQUENTIAL_KEY = OFF) ON [PRIMARY]
GO

ALTER TABLE [dbo].[MyTable] ADD  CONSTRAINT [DF_MyTable_RowGUID]  DEFAULT (NEWID()) FOR [RowGUID]
GO

的定义@InMemoryTableTypeTable是

CREATE TYPE [dbo].[TableType] AS TABLE(
    [ID] [bigint] NOT NULL,
    [RowID] [int] NOT NULL,
    [OETID] [int] NOT NULL,
     PRIMARY KEY NONCLUSTERED 
(
    [ID] ASC
)
)
WITH ( MEMORY_OPTIMIZED = ON )
GO

该表MyTable包含约 500k 行，并具有唯一的筛选索引，该索引具有：

WTID，OETID并按SRID该顺序作为键
过滤器，其中SRID> 0
Status作为包含的列

这意味着该EXISTS语句是可SARGable 的。

然而，根据有多少记录@InMemoryTableTypeTable以及 SQL Server 似乎处于什么状态，有时索引查找只会继续查找WTID并将其余谓词推入左反半连接。如果发生这种情况并且 SQL Server 本身的内存面临压力，则查询可能会等待 20 分钟左右。对于某些值，@WTID可能有 1 行，也可能有 200k 行刚刚在同一会话中插入。

这是一个好的计划：https://www.brentozar.com/pastetheplan/?id=H1- V_Jz7R

这是糟糕的计划：https://www.brentozar.com/pastetheplan/? id=SJD-QZGQA

有没有办法强制 SQL Server 每次都将谓词应用于索引查找中的所有 3 列？

我尝试将其从 IF 中打破并使用OPTIMIZE FOR UNKNOWN和OPTIMIZE FOR (@WTID UNKNOWN)提示，但无济于事。

查找更多的是为了并发性：每个会话在该表中的读取和写入将由 WTID 分隔。然而，删除这些表提示没有什么区别，它总是扫描 t 并查找 m，OETID 和 SRID 谓词的位置似乎会产生差异。

这篇文章《实际行数和估计行数差异很大》让我得到了ASSUME_MIN_SELECTIVITY_FOR_FILTER_ESTIMATES提示，该提示会生成我想要的计划（大多数时候）以及RECOMPILE. 将此与FORCE_LEGACY_CARDINALITY_ESTIMATION恢复“错误”计划结合起来。

2 个回答

Voted

Paul White · Answer 1 · 2024-05-16T15:44:58+08:00

解决方案

您可以将扩展FORCESEEK提示与所需的搜索键一起使用：

FROM dbo.MyTable AS M
    WITH (FORCESEEK(IDX(WTID, OETID, SRID)))

例如：

IF EXISTS 
(
    SELECT T.*
    FROM
    (
        SELECT I.RowID, I.OETID
        FROM @InMemoryTableTypeTable AS I
        UNION
        SELECT D.RowID, D.OETID
        FROM @InMemoryTableTypeTable AS D
    ) AS T
    WHERE    
        NOT EXISTS 
        (
            SELECT M.*
            FROM dbo.MyTable AS M 
                WITH 
                (
                    FORCESEEK(IDX(WTID, OETID, SRID)), -- !CHANGED!
                    ROWLOCK,
                    UPDLOCK
                )
            WHERE    
                M.OETID = T.RowID
                AND M.SRID = T.OETID
                AND M.WTID = @WTID
                AND M.[Status] <> 1
                AND M.SRID > 0
        )
)
...

解释

正如您所注意到的，原因是成本估算。由引入的查询EXISTS带有行目标，这使事情变得复杂。再加上包含其他几个难以估计的功能的查询，在这种情况下可能需要提示才能一致地获得所需的计划形状。

成本核算和勘探

“好”和“坏”计划的总估计成本都非常低，因此优化器不会花费太多时间进行搜索（请注意在根操作符处提前终止的“ Good Enough Plan Found”原因）。

优化器会考虑许多您在最终计划中未看到的替代方案。如果没有早期发现的低成本，它将继续考虑进一步的策略，如下图所示，将反半连接（作为apply）推到union之下：

无论如何，优化器并没有“被迷惑UNION”——它只是没有考虑到连接APPLY，而只是考虑连接（可以实现为嵌套循环、散列或合并）。

嵌套循环连接计划确实在内侧有一个查找，但这是不相关的谓词WTID = @WTID，它也可以出现在散列或合并连接中。其余谓词都是相关的，因此它们需要应用来下推。如果其中的概念不清楚，请参阅我的文章“应用与嵌套循环连接” 。

`IF EXISTS`

通常，您可以使用OPTION (USE HINT ('DISABLE_OPTIMIZER_ROWGOAL'))查询提示来禁用行目标行为，这也很可能可靠地生成所需的计划。

不幸的是，查询提示仅适用于顶级查询（IF EXISTS此处），而不适用于嵌套查询（您关心的查询）。添加提示时您确实看到了不同的计划，但这是因为查询文本不同，因此需要重新编译。

使用时IF EXISTS，您需要设置记录的跟踪标志 4138来禁用行目标。它必须在会话级别设置（使用DBCC TRACEON），因为QUERYTRACEON也仅适用于顶层。

您可以通过使用如下所示的模式来避免这种不明显的行为，而不是IF EXISTS（请参阅下面的相关问答）

DECLARE @Exists bit;

SELECT @Exists =
    IIF
    (
        EXISTS
        (
            --
            -- The query without IF EXISTS
            --
        ),
        CONVERT(bit, 'true'),
        CONVERT(bit, 'false')
    )
-- Query hints are effective now
OPTION (USE HINT ('DISABLE_OPTIMIZER_ROWGOAL'));

IF @Exists = CONVERT(bit, 'true')
BEGIN
    --
    -- Thing to do IF EXISTS
    --
END;

我提到所有这些都是为了兴趣。由于您已经使用了多个提示，因此扩展FORCESEEK是最佳选择。

索引查找和谓词下推

解决方案

解释

成本核算和勘探

`IF EXISTS`

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

索引查找和谓词下推

2 个回答

解决方案

解释

成本核算和勘探

IF EXISTS

相关问题

`IF EXISTS`