数据仓库是存储数据的一种组织形式它从传统数据库中获得原始数据先按辅助决策的主题要求形成当前基本数据层再按综合决策的要求形成综合数据层(又可分为轻度综合层和高度综合层)随着时间的推移由间控制机制将当前基本数据层转为历史数据层可见数据仓库中逻辑结构数据由层到层数据组成它们均由元数据(Meta Data) 组织而成数据仓库中数据的物理存储形式有多维数据库组织形式(空间超立方体形式)和基于关系数据库组织形式(由关系型事实表和维表组成)
数据仓库系统
数据仓库系统(DWS)由数据仓库仓库管理和分析工具三部分组成
源数据数据仓库的数据来源于多个数据源包括企业内部数据市场调查报告及各种
文档之类的外部数据
仓库管理: 在确定数据仓库信息需求后首先进行数据建模然后确定从源数据到数据仓库的数据抽取清理和转换过程最后划分维数及确定数据仓库的物理存储结构元数据是数据仓库的核心它用于存储数据模型和定义数据结构转换规划仓库结构控制信息等
数据仓库: 包括对数据的安全归档备份维护恢复等工作这些工作需要利用数据库管理系统(DBMS)的功能
分析工具用于完成实际决策问题所需的各种查询检索工具多维数据的OLAP分析工具数据开采DM工具等以实现决策支持系统的各种要求
数据仓库应用的C/S结构形式
数据仓库应用是一个典型的C/S结构其客户端的工作包括客户交互格式化查询及结果和报表生成等服务器端完成各种辅助决策的SQL查询复杂的计算和各类综合功能等现在一种越来越普遍的形式是三层结构即在客户与服务器之间增加一个多维数据分析服务器OLAP服务器能加强和规范决策支持的服务工作集中和简化原客户端和DW服务器的部分工作降低系统数据传输量因此工作效率更高