我第一次在 SO 上发布了这个但没有得到回复,这就是我现在在这里尝试的原因,我希望我这样做没有违反任何规则(手指交叉)。
我试图了解如何正确使用表分区和分区消除,以便我可以决定是否要在新数据库(sql server 17 express)中使用它。我倾向于不使用它,但这是一个不同的故事,所以这个问题更多的是我现在不知道它是如何工作的。在下面的脚本中,我创建了一个分区函数和方案,一个使用该方案的表,插入一些数据,然后以 3 种不同的方式查询它。
第一个查询正确地仅访问第一个分区(实际分区计数 = 1,实际访问的分区 = 1)。
我希望第二个查询也只能访问第一个分区,因为我已经在值 20200101 上创建了分区函数作为范围,但它正在访问分区 1 和 2(实际分区数 = 2,实际访问的分区 = 1. .2)。
我希望第三个查询只能访问分区 2,但它正在访问分区 2 和 3(实际分区计数 = 2,实际访问的分区 = 2..3)。
我知道我需要进行精确的类型匹配才能进行分区消除,但我想我在这里有吗?我错过了什么?
create partition function partfun (datetime2(0))
as range right for values ('20200101', '20210101')
create partition scheme ps
as partition partfun all to ([primary])
create table t
(
id int not null identity(1,1),
logdate datetime2(0)
) on ps(logdate)
insert into t values ('20190101'),('20200102')
select * from t where logdate < cast('20191231' as datetime2(0))
select * from t where logdate < cast('20200101' as datetime2(0))
select * from t where logdate >= cast('20200101' as datetime2(0)) and t.logdate < cast('20210101' as datetime2(0))
这些琐碎的查询会自动参数化。因此,在编译期间,文字值会被参数替换。使用范围搜索谓词中的内部 RangePartitonNew 函数在运行时动态消除分区。重要的是,搜索谓词开始/结束范围是包容性的,因此可以将相同的缓存计划重用于任何可能的值,而不仅仅是查询中的精确边界匹配。随后根据
WHERE
子句谓词过滤行以仅返回所需的行。下面是前 2 个查询的搜索谓词。在运行时,第一个查询 seek 等同于
partition_number >= 1 AND partition_number <= 1
,第二个是partition_number >= 1 AND partition_number <= 2
. 由于小于运算符,分区 1 被硬编码为起始范围。与第三个查询的查找谓词不同之处仅在于起始范围还包括 RangePartitionNew 以消除大于或等于比较运算符排除的分区。这个 seek 等同于 predicate
partition_number >= 2 AND partition_number <= 3
。您可以使用Paul 博客文章中的这些技术避免简单的参数化:
WHERE 1 <> 2
如果确切的边界值是您唯一的用例,您可以添加一个谓词来使用小于比较运算符评估分区函数。这将保留参数化的好处。例如:
生成的参数化计划搜索谓词从边界范围的末尾减去 1,以消除上述谓词排除的分区:
请注意,分区列上的索引将减少对这些变通方法的需求。即使一个额外的分区会被精确的边界值所触及,开销也只是几个额外的逻辑读取。