我正在尝试uniqueid
为每个孩子创建列(因为他们在表中出现多次),以便我可以识别同名的孩子(没有孩子具有相同的dadname
,mumname
和childdob
)
q)group select dadname, mumname, childdob from peopletb
dadname mumname childdob |
----------------------------------------------| -----------------
simon jessica 2007.03.27| 0 1658 2292 18295
mike rachel 2007.02.06| 1 4293 10976 33439 53751 63077 81844 90244 98782 ..
james lucy 2005.04.09| 2 12756 21354
francis anne 2007.04.12| 3 4151 8252 159075 172735 175531 177199 206953 40..
francis anne 2007.04.13| 7 3255 7292 128021 143595 157839 168120 186578 21..
mike rachel 2007.02.05| 10 4292 10946 33339 56751 67077 82844 96244 99381 ..
等等
问题是,在childdob
增加了一天和倒退一天的地方存在一些细微的差异。
对数据进行分组时,我希望将其childdob
彼此分组为 +1 或 -1,以消除差异。
例如
mike rachel 2007.02.05| 10 4292 10946 33339 56751 67077 82844 96244 99381 ..
&
mike rachel 2007.02.06| 1 4293 10976 33439 53751 63077 81844 90244 98782 ..
会有相同的唯一标识
就像
francis anne 2007.04.12| 3 4151 8252 159075 172735 175531 177199 206953 40..
&
francis anne 2007.04.13| 7 3255 7292 128021 143595 157839 168120 186578 21..
当您不知道真实的出生日期并且您有上下两个数据点时,会出现一些棘手的边缘情况,但像这样的情况可能是一个起点:
注意 james/jessica 将 2007.08.09/10 合并到 09 中,但没有合并 2007.01.02/04(含糊不清,不满足 2>yx)。但是,你可以增加 fudge 以
3>y-x
获得更多宽容