我最近在使用 Hive 2.3.9 版本时遇到了一个问题。
当我的分组依据设置为“a,b,c”并且分组集设置为(a,b,(a,b))时。
在上一个 Hive 版本中,grouping__id 的结果是当 "a" 时为 1 当 "b" 时为 2 当 "a,b" 时为 3。但是在 2.3.9 版本中,我发现结果是当 "a" 时为 1 当 "b" 时为 2 当 "a, b" 时为 0。新的正则与 Spark grouping__id Regular 相同。
我记得Hive Grouping__id的规则是从低到高,默认都是0,当出现维度时就重置为1,最后进行小数化。
但现在看上去好像已经改变了。
那么 Hive 做出了一些改变吗?