这篇论坛文章(赛迪网技术社区)深入探讨了搭建数据仓库过程中应当遵循的方法和原则更多内容请参考下文
一数据仓库的架构
数据仓库(Data Warehouse \ DW)是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库它的数据基于OLTP源系统数据仓库中的数据是细节的集成的面向主题的以OLAP系统的分析需求为目的
数据仓库的架构模型包括了星型架构(图二picbmp)与雪花型架构(图三picbmp)两种模式如图所示星型架构的中间为事实表四周为维度表类似星星;而相比较而言雪花型架构的中间为事实表两边的维度表可以再有其关联子表从而表达了清晰的维度层次关系
从OLAP系统的分析需求和ETL的处理效率两方面来考虑星型结构聚合快分析效率高;而雪花型结构明确便于与OLTP系统交互因此在实际项目中我们将综合运用星型架构与雪花型架构来设计数据仓库
那么下面我们就来看一看构建企业级数据仓库的流程
二构建企业级数据仓库五步法
(一)确定主题
即确定数据分析或前端展现的主题例如我们希望分析某年某月某一地区的啤酒销售情况这就是一个主题主题要体现出某一方面的各分析角度(维度)和统计数值型数据(量度)之间的关系确定主题时要综合考虑
我们可以形象的将一个主题想象为一颗星星统计数值型数据(量度)存在于星星中间的事实表;分析角度(维度)是星星的各个角;我们将通过维度的组合来考察量度那么某年某月某一地区的啤酒销售情况这样一个主题就要求我们通过时间和地区两个维度的组合来考察销售情况这个量度从而不同的主题来源于数据仓库中的不同子集我们可以称之为数据集市数据集市体现了数据仓库某一方面的信息多个数据集市构成了数据仓库
[] [] [] [] [] []