数据库

位置:IT落伍者 >> 数据库 >> 浏览文章

数据挖掘概述(二)


发布日期:2018年08月01日
 
数据挖掘概述(二)

数据挖掘工具是怎样准确地告诉你那些隐藏在数据库深处的重要信息的呢?它们又是如何作出预测的?答案就是建模建模实际上就是在你知道结果的情况下建立起一种模型并且把这种模型应用到你所不知道的那种情况中比如说如果你想要在大海上去寻找一艘古老的西班牙沉船也许你首先想到的就是去找找过去发现这些宝藏的时间和地点有哪些那么经过调查你发现这些沉船大部分都是在百慕大海区被发现并且那个海区有着某种特征的洋流以及那个时代的航线也有一定的特征可寻在这众多的类似特征中你将它们抽象并概括为一个普适的模型利用这个模型你就很有希望在具有大量相同特征的另外一个地点发现一件不为人知的宝藏

当然在数据挖掘技术甚至计算机出现以前这种建模抽象的方法就已经广泛地被人们所使用在计算机中的建模和以前的建模方法并无很大不同主要的差异在于计算机能处理的信息量比起以前来更加庞大计算机中能够存储已知了结果的大量不同情况然后由数据挖掘工具从这些大量的信息里面披沙拣金将能够产生模型的信息提取出来一当模型建立好了之后就可以应用在那些情形相似但结果尚未知的判断中了比如现在假设你是一个电信公司的营销主任公司想发展一些新的长途电话用户那么你是不是会漫无目的地到街上去散发广告呢?——就象漫无目的地在海上去寻宝一样其实比起漫无目的地去进行宣传来利用你以前的商业经验来有目的地去拉拢客户会产生高得多的效率

作为一个营销主任你对客户的很多信息都可以了解得一清二楚年龄性别信用记录以及长途电话使用状况从好的一方面来看掌握了这些客户的信息其实就是掌握了很多潜在的用户的同样的信息问题在于你还不一定了解他们的长途电话使用情况(因为他们的长途电话也许是通过的另一个电信公司)现在你的主要精力就集中在用户中谁有比较多的长途电话上通过下面这个表格我们可以从数据库里面抽象某些变量建立起一个可以对此进行分类营销的模型

客户 潜力

一般信息

(eg demographic data) 已知 已知

私有信息

(eg customer transactions) 已知 待定

数据挖掘应用于分类营销

根据我们创建的从一般信息到私有信息的计算模型我们可以得出表二右下方表格中的信息比如一个电信公司的简化模型可以是年薪万美圆以上的%的客户每个月长话费美圆以上根据这个模型我们就能应用这些数据来推断出公司现在尚不能明确的私有信息这样新客户群体就可以大体确定出来了小型市场的试销数据对于这样的模型来说显得极为有用因为小范围内试销数据的挖掘能够为全部市场的分类销售打下一个良好的基础表三则描述了另外一样数据挖掘的普遍应用预测

过去 现在 将来

静态信息和当前计划 已知 已知 已知

动态信息 已知 已知 待定

数据挖掘应用于预测

数据挖掘的体系结构

现有很多数据挖掘工具是独立于数据仓库以外的它们需要独立地输入输出数据以及进行相对独立的数据分析

了最大限度地发挥数据挖掘工具的潜力它们必须象很多商业分析软件一样紧密地和数据仓库集成起来这样在人们

对参数和分析深度进行变化的时候高集成度就能大大地简化数据挖掘过程

集成后的数据挖掘体系

应用数据挖掘技术较为理想的起点就是从一个数据仓库开始这个数据仓库里面应保存着所有客户的合同信息并且还应有相应的市场竞争对手的相关数据这样的数据库可以是各种市场上的数据库SybaseOracleRedbrick和其他等等并且可以针对其中的数据进行速度上和灵活性上的优化

联机分析系统OLAP服务器可以使一个十分复杂的最终用户商业模型应用于数据仓库中数据库的多维结构可以让用户从不同角度——比如产品分类地域分类或者其他关键角度——来分析和观察他们的生意运营状况数据挖掘服务器在这种情况下必须和联机分析服务器以及数据仓库紧密地集成起来这样就可以直接跟蹤数据和并辅助用户快速作出商业决策并且用户还可以在更新数据的时候不断发现更好的行为模式并将其运用于未来的决策当中

数据挖掘系统的出现代表着常规决策支持系统的基础结构的转变不象查询和报表语言仅仅是将数据查询结果反馈给最终用户那样数据挖掘高级分析服务器把用户的商业模型直接应用于其数据仓库之上并且反馈给用户一个相关信息的分析结果这个结果是一个经过分析和抽象的动态视图层通常会根据用户的不同需求而变化基于这个视图各种报表工具和可视化工具就可以将分析结果展现在用户面前以帮助用户计划将采取怎样的行动

产生利润的工具

有很多公司都成功地安装了数据挖掘工具早先采用了这种技术的公司大部分都是信息密集型公司比如金融服务和邮件营销系统但是现在这种技术已经准备好应用于各个公司中只要公司具有大型数据库并且有强烈的通过软件技术改善公司管理的愿望但是采用数据挖掘技术公司必须两个关键的因素一个就是大型的集成化的数据库另一个就是定义完善的商业处理程序这样数据挖掘才好紧密地应用于公司数据之上

采用数据挖掘技术的一些成功应用例如一个药品公司通过对它最近的营销强度和销售结果的分析来决定哪一种营销活动在最近几个月内对高附加值的医生群体影响最大这样的分析建立在竞争对手的销售活动信息和当地健康状况的数据系统之上然后这个药品公司可以通过其办公网络将分析结果传达到各地的销售代表处销售代表们则可以根据公司传递的关键信息来作出相应的销售抉择这样在快速变化的动态的市场上销售代表们都可以根据各种特殊情况的分析作出最优的选择

结语

全面集成了客户供应者以及市场信息的大型数据仓库导致公司内的信息呈爆炸性增长企业在市场竞争中需要及时而准确地对这些信息作复杂的分析为了更加及时地更加准确地作出利于企业的抉择建立在关系数据库和联机分析技术上的数据挖掘工具为我们带来了一个新的转机目前数据挖掘工具正以前所未有的速度发展并且扩大着用户群体在未来越加激烈的市场竞争中拥有数据挖掘技术必将比别人获得更快速的反应赢得更多的商业机会

上一篇:Oracle Enterprise Manager常见问题及解决

下一篇:如何在Oracle中使用Sequence