SQL Server：使用“有效”日期连接两个表

Question

mtilhan

Asked: 2016-04-02 02:28:23 +0800 CST2016-04-02 02:28:23 +0800 CST 2016-04-02 02:28:23 +0800 CST

Hash Join 如何与相等运算符以外的关系运算符一起使用？

772

我一直在阅读 Hash Join 及其在物理层面上的工作原理。但是，有些事情我不明白（因为我缺乏知识）。

这是我找到的Hash Join的算法；

for each row R1 in the build table
    begin
        calculate hash value on R1 join key(s)
        insert R1 into the appropriate hash bucket
    end
for each row R2 in the probe table
    begin
        calculate hash value on R2 join key(s)
        for each row R1 in the corresponding hash bucket
            if R1 joins with R2
                return (R1, R2)
    end

这似乎足以满足诸如"TABLE1.NAME == TABLE2.NAME"etc 之类的连接条件。但是，当连接条件为"TABLE1.NAME == TABLE2.NAME" && "TABLE1.AGE > TABLE2.AGE".

我只是无法找到并理解他们如何生成或比较需要相等运算符和其他一些关系运算符（如大于等）的哈希值。

1 个回答

Voted

Paul White · Answer 1 · 2016-04-02T02:47:53+08:00

Best Answer

Paul White

2016-04-02T02:47:53+08:002016-04-02T02:47:53+08:00

从您正在阅读的文章（克雷格弗里德曼）：

Hash join 与 merge join 有很多共同的特点。和merge join一样，至少需要一个equijoin predicate，支持residual predicates，支持所有outer和semi-joins。

_（强调）

散列键是根据（必需的）等值连接谓词构建的。所有其他谓词都在桶扫描期间进行评估，因此名称为“剩余谓词”。

在您的示例中， Name 将用于形成哈希键。在初始哈希探测之后，将对匹配哈希桶中的所有行评估年龄谓词。在散列键不唯一的情况下，自然也会比较存储桶中散列列的实际值。

散列连接的执行计划属性（无论如何在 SQL Server 中）将向您显示构建散列键和任何剩余项。

6

Hash Join 如何与相等运算符以外的关系运算符一起使用？

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

Hash Join 如何与相等运算符以外的关系运算符一起使用？

1 个回答

相关问题