我正在考虑在我的 Stack Overflow 数据库副本中创建过滤索引。像这样的东西,例如:
CREATE UNIQUE NONCLUSTERED INDEX IX_DisplayName_Filtered
ON dbo.Users (DisplayName)
WHERE Reputation > 400000;
我是否应该始终将过滤表达式中的列(Reputation
在本例中)添加到键或包含索引,或者将它放在过滤表达式中就足够了吗?
我正在考虑在我的 Stack Overflow 数据库副本中创建过滤索引。像这样的东西,例如:
CREATE UNIQUE NONCLUSTERED INDEX IX_DisplayName_Filtered
ON dbo.Users (DisplayName)
WHERE Reputation > 400000;
我是否应该始终将过滤表达式中的列(Reputation
在本例中)添加到键或包含索引,或者将它放在过滤表达式中就足够了吗?
是的!
由于各种原因,将过滤列作为索引的一部分总是更好:在键中或在包含中
以下是过滤索引查询问题的一些具体示例,这些问题是通过在索引中包含过滤列来解决的。
查询谓词与过滤表达式不匹配时的键查找
首先,文档中有关于包含过滤器表达式列的说明:
因此,如果您有一个不等式过滤器表达式,例如
Reputation > 400000
,但您的查询使用了一个谓词,例如WHERE Reputation > 400000 AND Reputation < 450000;
,过滤后的索引可能仍会被使用——但需要进行键查找以满足查询的谓词。在索引中包含该
Reputation
列(键或包含)可以消除此查找的需要。有关更多详细信息和这种情况的示例,请参阅 Erik Darling 的帖子过滤索引:只需添加包含。
另一个例子可以在 Paul White 的回答中找到:Unnecessary key lookup being performed while using filtered index
结果集中包含过滤列时的键查找
文档继续说:
这似乎不言而喻,但只是为了完整:如果您的查询在最终结果集中包含过滤列,您可能应该将它们包含在索引中(键或包含)。
使用相等表达式时行估计不佳
在某些情况下,可以在优化过程中消除基于实际统计信息的有用行估计(特别是当优化器生成的查询计划转换为物理执行计划时)。包括过滤列可以防止这些更准确的估计被丢弃。
更多细节和示例可以在 Paul White 的回答中找到:Incorrect row estimation given with a filtered index
在 dba.se 上可以找到另一个示例:Query using a filtered index but wrong estimated number of rows
IS NULL
在过滤表达式中使用时的键查找使用使用的过滤表达式创建索引
IS NULL
会产生完全不必要的键查找。请参阅此问题,以及 SQL Server 反馈站点上的相关错误报告:Why filtered index on IS NULL value is not used?正如您可能已经猜到的那样,提供的解决方法是将过滤列添加为过滤索引中的包含列。