第二步按照业务逻辑的规则对数据进行归并
把ODS中不同主题中的表示相同业务的数据(来自不同的业务系统)进行归并例如一般企业的客服系统(Call Center)都受理一部分业务而这些业务受理与在营业厅或销售店的受理是一样的因此这类数据要归并到一起
第三步把包含细节过多的交易记录进行拆分
事实上一个交易记录所包含的信息内容非常丰富往往超越了某个人或部门的分析需求但不同的人有不同的关注点因此为提高性能起见我们需要把一个长记录包含的信息进行分析分解汇总例如在电信企业中经过二次批价后的通话详单包含多种信息经过分析它包括网络信息业务类型信息时间信息地理信息费用信息这样几个类别的信息而每一类信息都由几个字段来进行记录这些不同类别的信息是很少有人都同时关心的一般来说网管部门关心网络信息市场部门关心业务类型信息而时间信息和地理信息恰是所有部门都需要的按照这样的情况我们把一条话单按照信息内容进行拆分拆分后进行汇总归并以支持不同部门的分析要求当然对于数据挖掘应用可能同时关心所有的信息以发掘不同信息之间的关系但这种情况一则很少二则真正的数据挖掘更多的时候依赖于交易细节数据也就是说对于专题问题的研究可以从ODS中进行数据的再次处理
第四步汇总再汇总
汇总的问题决不仅仅是为了提高性能而做的事情(当然汇总能够有效提高性能)但汇总同时意味着更高程度的综合在这个过程中我们会发现与ODS系统设计过程相反我们从细节走向了宏观在ODS中我们初步确定了企业信息模型对企业信息模型进行初步分解再分解再分解得到了一个个的主题;在数据仓库中我们从一个个的主题开始综合再综合我们沿着与ODS相反的方向走向了企业的宏观数据视图事实上在DW设计中汇总综合的终极目标是要在最后把多个主题汇总成为一个大的主题而这个主题所包含的维度和度量就是这个企业运行的命脉指标是企业老板所最为关注的那几个指标
[] [] [] [] [] [] []