当我运行以下代码时,它需要 22.5 分钟并进行 1.06 亿次读取。但是,如果我只运行内部 select 语句,它只需要 15 秒并进行 264k 读取。作为旁注,选择查询不返回任何记录。
知道为什么它IF EXISTS
会使其运行时间更长并进行更多读取吗?我还将 select 语句更改为 doSELECT TOP 1 [dlc].[id]
并在 2 分钟后将其杀死。
作为临时修复,我已将其更改为进行计数(*)并将该值分配给变量@cnt
。然后它会做一个IF 0 <> @cnt
声明。但我认为EXISTS
会更好,因为如果在 select 语句中返回了记录,一旦找到至少一条记录,它将停止执行扫描/搜索,而count(*)
将完成完整的查询。我错过了什么?
IF EXISTS
(SELECT [dlc].[ID]
FROM TableDLC [dlc]
JOIN TableD [d]
ON [d].[ID] = [dlc].[ID]
JOIN TableC [c]
ON [c].[ID] = [d].[ID2]
WHERE [c].[Name] <> [dlc].[Name])
BEGIN
<do something>
END
正如我在回答这个相关问题时所解释的那样:
TOP 如何(以及为什么)影响执行计划?
Using
EXISTS
引入了一个行目标,优化器生成一个执行计划,旨在快速定位第一行。在这样做时,它假设数据是均匀分布的。例如,如果统计数据显示 100,000 行中有 100 个预期匹配,它将假定它只需读取 1,000 行即可找到第一个匹配。如果这个假设被证明是错误的,这将导致比预期更长的执行时间。例如,如果 SQL Server 选择的访问方法(例如无序扫描)恰好在搜索中很晚才找到第一个匹配值,则可能会导致几乎完整的扫描。另一方面,如果恰好在前几行中找到匹配行,则性能将非常好。这是行目标的基本风险 - 性能不一致。
通常可以重新构造查询,以便不分配行目标。如果没有行目标,查询仍然可以在遇到第一个匹配行时终止(如果编写正确),但执行计划策略可能会有所不同(并且希望更有效)。显然,count(*) 需要读取所有行,所以它不是一个完美的选择。
如果您正在运行 SQL Server 2008 R2 或更高版本,您通常还可以使用记录和支持的跟踪标志 4138来获取没有行目标的执行计划。也可以使用支持的提示
OPTION (QUERYTRACEON 4138)
指定此标志,但请注意它需要运行时系统管理员权限,除非与计划指南一起使用。很遗憾
以上都不适用于
IF EXISTS
条件语句。它仅适用于常规 DML。它将与您尝试的替代配方SELECT TOP (1)
一起使用。COUNT(*)
如前所述,这可能比 using 更好,后者必须计算所有合格的行。也就是说,有多种方法可以表达此要求,使您可以避免或控制行目标,同时提前终止搜索。最后一个例子:
因为 EXISTS 只需要找到单行,它会使用一个行目标。这有时会产生一个不太理想的计划。如果您希望它对您来说会是这样,请使用 a 的结果填充一个变量,
COUNT(*)
然后测试该变量以查看它是否大于 0。所以......对于一个小行目标,它将避免阻塞操作,例如构建哈希表或排序可能对合并连接有用的流,因为它会认为它一定会很快找到一些东西,因此嵌套循环会如果它发现了什么最好。除了这可以制定一个在整个系列中更糟糕的计划。如果找到单行很快,您会喜欢这种避免阻塞的方法......