即使你无需知道所有成千上万的语言和工具来处理各种程序但是你应该知道当需要它们的时候如何选择它们现在让我们看看微软件SQL Server分析服务支持的多维表达语言(MDX)虽然我不可能在一篇简短的文章介绍所有的语言但我可以为你提供一个大致的轮廓以便让你在需要的时候如何去选择
OLTP vs OLAP
理解数据库两个类之间的定义是非常重要的诸如SQL Server的关系数据库有时候也被称为在线处理过程(OLTP)数据库这样的数据库已经被优化而可以高效率地存储和获取简单的各种信息例如你可以知道公司仓库的Colony Bagels的销售情况或者的七月份的销售情况为了获取这样的信息你可以编写如下的SQL查询语句
SELECT SUM(Sales[Unit Sales])
FROM (Sales INNER JOIN Stores
ON SalesStoreID = StoresStoreID)
INNER JOIN Products
ON SalesProductID = ProductsProductID
WHERE StoresStoreCity = Corvallis
AND ProductsProductName = Colony Bagels
AND SalesSaleDate BETWEEN AND
对于获取特定信息这样的查询是相当出色的但是OLTP数据库和SQL查询发生异常通常是在数据量很大的时候你如何知道以不同状态存储的产品之间的区别呢?当然你可以编写一个SQL查询来获取这样的信息但因为它要涉及到所有的源数据所以这样的查询会变得相当的缓慢连接与联合也会变得很狭窄
使用在线处理过程(OLAP)会避免这样的窘境OLAP数据库可以从OLTP数据库(或其他数据库)中得到它们的源数据但它们以多维形式存储一个OLAP数据库可以以不同状态和不同产品而预先计算所有的数据
简化信息的不同类型被称为维数(dimensions)通过多维简化大量数据的数据结构被称为一个立体(cube)简化信息被称为量度(measure)任何一个立体都有一个或多个维数和量度
建立一个立体需要花时间和计算马力(horsepower)通常这样过程可以以固定的时间间隔进行这一方法的好处是一个立体建立之后 浏览时无需要涉及到原始数据
图A显示了关于Microsoft SQL Server 分析服务的Sales立体总貌
图 A在一个立体中浏览数据
使用MDX
MDX在语法上与SQL很相似但它却具备处理一个OLAP立体中多维数据的更好功能对于绝大多数的通用任务你都可以使用MDX来获取一个立体中的信息毕竟OLAP数据库的主要作用就是更容易地得到简化信息具体实现这一功能即MDX SELECT语句这与SQL SELECT语句有很大的区别
一个MDX SELECT语句可以表达如下
SELECT [ …]
FROM WHERE axis语句指明了要返回的简化信息通常它们都是一些维数Cube语句指定包含数据的OLAP立体Slicer语句指定要返回的相关数据通常是量度以下的MDX查询将获得需要的信息
SELECT
[Store][Store Country][USA]Children ON COLUMNS
[Product][All Products][Food]Children ON ROWS
FROM [Sales]
WHERE ([Measures][Unit Sales])
在这种情况下有两种axis规则其中一个为输出的纵数另一个为输出的行数每一种规则都指定了维数的一部分图B显示了运行MDX范例程序的结果
图 B 运行一个MDX查询
MDX的深度
还有更多的MDX我无法在一个简单的查询为你提供所有内容当然以下给出了可以使用MDX来处理高级任务的列表
可以返回多达维数的结果(虽然你无法找到显示这些维数的工具)
查找最大或最小数值
灵活的排列结果
结合现有的量度计算新的成员
返回单个量度的属性
格式结果
对比不同的时间间隔
在外部类库中定义常用功能
MDX的目标非常明确那就是联合分析服务来提供获取大批数据的有效机制任何时候每一步工作都围绕大规模数据库而开展你应该把MDX当成解决问题的一种工具