我有两张桌子:
日期表:
date:原始日期,id:标识符,Plus1:日期 + 1,Plus2:日期 + 2,Neg1:日期 - 1,Neg2:日期 - 2
日期 | ID | 加1 | 加2 | 负1 | 负2 |
---|---|---|---|---|---|
1/1/24 | 1A | 1/2/24 | 1/3/24 | 12/31/23 | 12/30/23 |
1/5/24 | 2B | 1/6/24 | 1/7/24 | 1/4/24 | 1/3/24 |
date_table: ([] Date: 2024.01.01 2024.01.05; ID: `1A`2B; Plus1: 2024.01.02 2024.01.06; Plus2: 2024.01.03 2024.01.07; Neg1: 2023.12.31 2024.01.04; Neg2: 2023.12.30 2024.01.03)
数据:
日期 | ID | 姓名 | 地方 |
---|---|---|---|
1/1/24 | 1A | 安 | 顺丰 |
12/31/23 | 1A | 起诉 | 西雅图 |
12/20/23 | 1A | 伊恩 | 纽约 |
1/5/24 | 2B | 鲍勃 | 洛杉矶 |
1/7/24 | 2B | 伊恩 | 沃斯堡 |
1/1/24 | 1A | XYZ | 芝加哥 |
data: ([] Date: 2024.01.01 2023.12.31 2023.12.20 2024.01.05 2024.01.07 2024.01.01; ID: `1A`1A`1A`2B`2B`1A; Name: `Ann`Sue`Ian`Bob`Ian`XYZ; Place: `SF`Seattle`NY`LA`FortWorth`Chicago)
我想要获取的是日期范围内每个 data_table 的唯一名称和位置的列表以及匹配的 ID。
从上面两个表中,我想要以下内容:
日期 | ID | 姓名 | 地方 |
---|---|---|---|
1/1/24 | 1A | 安 | 顺丰 |
12/31/23 | 1A | 起诉 | 西雅图 |
1/5/24 | 2B | 鲍勃 | 洛杉矶 |
1/7/24 | 2B | 伊恩 | 沃斯堡 |
1/1/24 | 1A | XYZ | 芝加哥 |
请注意,数据表中的 12/20/23-Ian 行被省略,因为该日期不在原始日期 +/- 2 天范围内。
我正在考虑做类似的事情date_table lj `Date`ID xkey select Date, ID, Name, Place from data;
,但是,这种左连接没有考虑日期列周围的 + 和 - 2 天。它还没有考虑多个名称/地点组合,例如 1/1/24 ID 1A 有两行匹配(来自 SF 的 Ann 和来自芝加哥的 XYZ)。
这是左连接的输出:
日期 | ID | 加1 | 加2 | 负1 | 负2 | 姓名 | 地方 |
---|---|---|---|---|---|---|---|
2024年1月1日 | 1A | 2024.01.02 | 2024.01.03 | 2023年12月31日 | 2023年12月30日 | 安 | 顺丰 |
2024年1月5日 | 2B | 2024年1月6日 | 2024年1月7日 | 2024.01.04 | 2024.01.03 | 鲍勃 | 洛杉矶 |
我能想到的一件事是做 5 个不同的左连接,每个日期一个,然后聚合,但是我认为可能有更好的方法来获取此输出,特别是因为左连接不会聚合所有名称/地点数据。
我正在考虑使用左连接,因为数据很多,逐行进行会非常慢。感谢任何想法,因为我不确定我前进的方向是否正确。
如果您需要我澄清,请告诉我。
您可以使用一种不需要的方法
lj
:在这里,我使用相关条目
data_table
作为函数的参数。该函数是一个功能选择,它在允许的范围内选择 ID 的条目(
x
是 ID,y
是范围开始,z
是结束)。针对每个 ID 和范围运行该函数,并将结果与 组合在一起
raze
。