给出以下两个表:
CREATE TABLE SalesLedger (
Id int PRIMARY KEY IDENTITY,
Date date NOT NULL,
Total decimal(38,18),
INDEX IX (Date, Total)
);
CREATE TABLE Purchases (
Id int PRIMARY KEY IDENTITY,
Date date NOT NULL,
Total decimal(38,18),
INDEX IX (Date, Total)
);
以及下面的视图
CREATE VIEW ViewMetrics
AS
Select
Date,
'Sale' as Metric,
Total as Value
From SalesLedger
UNION ALL
Select
Date,
'Purchase' as Metric,
Total as Value
From Purchases;
以下查询使用一Concatenation
Sort
对:
Select SUM(Value) as Sales, Date
from ViewMetrics
Group By Date;
而较小的重写可以明显提高性能Merge Concatenation
SELECT SUM(Sales), Date
FROM (
Select SUM(Value) as Sales, Date
from ViewMetrics
Group By Metric, Date
) t
GROUP BY Date;
编译器可以清楚地看到视图是按 分区的Metric
,正如这个查询所示,不需要Sort
:
Select SUM(Value) as Sales, Date
from ViewMetrics
where Metric = 'Sale'
Group By Date;
问题是:为什么第一个查询强制 a Sort
,而第二个查询可以使用更有效的Merge Concatenation
,因为在这两种情况下该Metric
列都没有WHERE
谓词?
Merge
鉴于索引已经排序Date
并且分区已打开,编译器是否应该能够看到 a可以工作Metric
?或者如果它看不到这一点,为什么GROUP BY Metric, Date
突然赋予它这种能力?
更奇怪的是,正如 @MartinSmith 发现的那样,如果没有数据,那么编译器将使用更好的计划,尽管没有中间聚合Metric, Date
。db<>fiddle另一方面,没有部分聚合的合并可能比部分聚合后的排序慢,因为有更多的行需要合并。问题是为什么它不能默认同时进行部分聚合和合并?
我猜测当聚合包含分区时,分区视图有一些特定的优化,因为在这种情况下它使用串联,并且当需要排序时它使用合并串联,请参阅 db<> fiddle。当您想要进一步聚合时,这会有所帮助,因为数据现在已经按正确的顺序排序。但是,如果您不进行中间聚合,它就没有应用它的逻辑。