随着市场竞争的加剧和信息社会需求的发展从大量数据中提取(检索查询等)
制定市场策略的信息就显得越来越重要了这种需求既要求联机服务又涉及大量用
于决策的数据而传统的数据库系统已无法满足这种需求其具体体现在三个方面
历史数据量很大
辅助决策信息涉及许多部门的数据而不同系统的数据难以集成
由于访问数据的能力不足它对大量数据的访问性能明显下降
随着C/S技术的成熟和并行数据库的发展信息处理技术的发展趋势是从大量的
事务型数据库中抽取数据并将其清理转换为新的存储格式即为决策目标把数据
聚合在一种特殊的格式中随着此过程的发展和完善这种支持决策的特殊的数据
存储即被称为数据仓库(Data Warehouse DW)
WHInmon对数据仓库的定义为数据仓库是支持管理决策过程的面向主题的集成
的稳定的不同时间的数据集合
主题是数据归类的标准每个主题对应一个客观分析领域如客户商店等它可为
辅助决策集成多个部门不同系统的大量数据数据仓库包含了大量的历史数据经集
成后进入数据仓库的数据是极少更新的数据仓库内的数据时限为年至年主要
用于进行时间趋势分析数据仓库的数据量很大一般为GB左右它是一般数据库
(MB)数据量的倍大型数据仓库达到TB级
数据仓库主要应用在两个方面
使用浏览分析工具在DW中寻找有用的信息
数据仓库系统支持在DW上的应用形成决策支持系统(DSS)
---
数据仓库是关系型的
仓库保存的数据通常是历史数据而且数据仓库保存的数据量极大可能达到GBTB级
甚至更大这些数据在数据仓库中很少变动
对于数据仓库通常只进行APPEND操作
对信息源的数据的提取和集成采用批处理的方式进行通常脱机处理