考虑下表,
CREATE TABLE GapsIslands (ID INT NOT NULL, SeqNo INT NOT NULL);
ALTER TABLE GapsIslands ADD CONSTRAINT pk_GapsIslands PRIMARY KEY (ID, SeqNo);
INSERT INTO GapsIslands
SELECT 1, 1 UNION ALL SELECT 1, 2 UNION ALL SELECT 1, 5 UNION ALL SELECT 1, 6
UNION ALL SELECT 1, 8 UNION ALL SELECT 1, 9 UNION ALL SELECT 1, 10 UNION ALL SELECT 1, 12
UNION ALL SELECT 1, 20 UNION ALL SELECT 1, 21 UNION ALL SELECT 1, 25 UNION ALL SELECT 1, 26;
我正在努力理解NOT EXISTS
在差距和岛屿解决方案的背景下条件的应用。
以下查询旨在查找“岛屿”的起点:
SELECT ID, SeqNo, ROW_NUMBER() OVER (ORDER BY SeqNo) AS RowNum
FROM GapsIslands AS a
WHERE NOT EXISTS (
SELECT *
FROM GapsIslands AS b
WHERE b.ID = a.ID AND b.SeqNo = a.SeqNo - 1)
现在在 NOT EXISTS 条件下的查询,
SELECT *
FROM GapsIslands AS b
WHERE b.ID = a.ID AND b.SeqNo = a.SeqNo - 1
返回,列(让我们将此列称为 A)SeqNo 为:
SeqNo
1
5
8
9
20
25
SeqNo 的“完整”列(我们称之为 B 列)是:
SeqNo
1
2
5
6
8
9
10
12
20
21
25
26
那么,为什么当我们在 A 列中取 B 列值 WHERE NOT EXISTS 时,我们会找到该列吗?
SeqNo
1
5
8
12
20
25
B列的值1也是IN列A,那么为什么值1会出现在查询的SeqNo列中呢?
让我们将有问题的表达式从
WHERE
条件移动到SELECT
输出列表。EXISTS
给出布尔值,SQL server 不想直接显示,所以我们将使用CASE
它并将其转换为可读形式。小提琴
该查询为我们提供了下一个输出:
似乎是绝对清楚的。SeqNo=1 没有先前的值,因为根本没有这样的记录,SeqNo=5 (以及其他所有) - 因为之前有一个间隙。
当我们在“Exists”的记录中使用这个
EXISTS
表达式时,WHERE
将被删除,我们将只获得“不存在”的记录(不要忘记还有额外的NOT
运算符,所以只会FALSE
返回给定的记录)。ROW_NUMBER()
,它在 之后起作用,它WHERE
简单地以给定的顺序枚举返回的记录。PS。正在考虑的查询(由 OP 发布)不包含 ORDER BY 子句。那很不好。这可能会导致记录以随机顺序返回。尽管如此,计算出的记录数
ROW_NUMBER()
将是正确的,因为该函数有其自己的本地排序。