我浏览了整个网站列表,这是我认为最好的匹配。这实际上与数据库管理无关,更像是数据库设计。请原谅我并将我指向正确的站点。
我正在为基本的 BI 系统设计一个数据库。此刻我碰壁了,就是这样(使用虚拟数据进行解释):
假设我的事实表包含以下信息:
John Doe flew from LAX to ATL on 1 Nov in flight AB-123
维度及其属性为:
- 传单 - 名称、俱乐部
- 机场 - 城市,代码
- 日期 - 年、月、日
- 航班 - 代码、标准、延误、价格
现在,我可以很容易地生成这样的报告:
Airport --> LAX DFW ORD ATL Total
Gold 50 40 10 25 125
Silver 240 300 95 140 775
Bronze 1000 1500 800 1800 5100
Total 1290 1840 905 1965 6000
使用如下查询:
select fd.club, ad.code, count(f1.id) from flyer fd, airport ad, fact1 f1
where fd.id = f1.fid and ad.id = f1.aid and month(f1.date) = 10
group by f1.club, ad.code;
但我的问题来自传单的“俱乐部”状态是一个移动目标。今天处于黄金状态的传单可能在 10 月份处于白银状态,所以我在这里将他算在错误的组中。因此,我想我需要一个像这样的单独事实表:
John Doe entered Bronze club on 8/15
John Doe entered Silver club on 10/20
...
“俱乐部”作为原始传单维度的属性退出。相反,出现了一个新的俱乐部维度。
然后为了生成我需要的报告,我加入了这两个事实表。
我在正确的轨道上吗?或者是否有其他更简单的解决方案?我能想到的另一种选择是将俱乐部包含在原始事实表中,在 ETL 过程中处理它。所以事实变成了:
John Doe of Silver Club flew from LAX to ATL on 1 Nov in flight AB-123
请让我知道哪种方法更好,或者是否有第三种方法。