我有一个基本上像这样的源表:
- 员工守则
- 周开始日期
- 工作日 1
- 工作日 2
- 工作日 3
- 工作日 4
- 工作时间5
- 工作日 6
- 工作日 7
实际的表格每个工作日有大约 500 个编号的列(并没有真正计算它们 - 有各种各样的编号为 1-7 的字段,然后是另外一些编号为 1-25,乘以 7 的字段(不,那不是我的设计) ,目前大约有 38,600 行(每周增长)。
我有一个 SSIS 包试图规范化这些数据......目前看起来像这样:
每个“源”从同一个源表中选择一组编号的列,UNION ALL 组件将 7 个源合并为一个,产生大约 258,900 行。
工作流的其余部分添加一些计算列,查找代理键(例如EmployeeCode
用于查找EmployeeId
,然后计算日期并用于查找 a TimeId
),然后更新“修改”行和“新”行一个被插入到一个规范化的表中;未更改的行最终无处可去。
有没有更好的方法(例如,减轻内存压力)来规范化源数据?