我正在尝试对 DW 建模,其中我有多个地理级别(邻里、地区、城市、州)。
我有几个应该包含在模型中的人口统计数据。这些数据包括居住在该地区的人数、平均月收入、平均年龄等。我有数据的最低级别是邻域,这意味着它可以组合在一起以计算更高级别的值。
地理在单个(非规范化)维度中建模,其中每个级别都有自己的列。
现在我必须在模型中拟合人口统计数据。我应该把它放在另一个单独的维度中,还是应该放在地理维度中?综合水平如何?
将其全部放在地理维度上会给我留下大量的列:
- ID
- 街区名称
- 地区名称
- 城市名
- 州名
- 社区平均月收入
- 社区平均工作人口年龄
- 邻里人数
- ...
- 地区平均月收入
- 地区平均工作人口年龄
- 地区人数
- ...
- 城市平均月收入
- 城市平均工作人口年龄
- 城市人数
- ...
这个对吗?这看起来比较绕。我在几本书(包括 Kimball 的)中搜索了替代设计,但没有找到任何令人满意的东西。
这种设计是否有更好、经过验证、认可和可靠的替代方案?