一、引言

Mondrian, 蒙得里安·皮特1872-1944荷兰画家,作品以交错的三原色为基色的垂直线条和平面为特点,他的著作包括 新造型主义(1920年),对抽象艺术的发展曾经产生很深影响。——金山词霸如是说。

不过,本文所要讨论的可不是这位艺术家。那到底mondrian是什么呢?

Mondrian是一个开源项目。一个用Java写成的OLAP(在线分析性处理)引擎。它用MDX语言实现查询,从关系数据库(RDBMS)中读取数据。然后经过Java API用多维的方式对结果进行展示。

我们都知道,在线分析处理(OLAP)要实时地分析大量数据。“online”这个词的含义就是即使相关的数据量是巨大的——可能以GB为单位——系统也要足够快的响应以显示结果。

OLAP用了多维分析的技术。尽管关系型数据库所存储的所有数据都是以行和列的形式存在的,但一个多维数据集还是可以由轴(axes)和单元(cell)组成。

在上面的例子中,时间是个维度(dimension),而它下面的层次(Hierarchies)又分为半年、季度等级别(Level)。

二、感性认识——运行一个小实例

我们暂时先不讨论Mondrian所用到的一些技术。我们可以先从一个小例子开始,不必在意每个细节,只是希望大家有个感性认识先。在实施这个例子的过程中,或许读者就能见些端倪。

首先应该到http://sourceforge.net/projects/mondrian/下载mondrian的最新版本。这是一个zip包,包括我们要用到的lib和一个例子。

当然,读者完全可以运行mondrian自带的实例,不过这个例子有些纷繁复杂,除了Mondrian本身还有其它技术在里面,不大容易讲清楚,也不太适合初学者学习。所以,笔者在这里设计一个简洁干净的最小化实例。

本文所阐述的实例环境是Windows2000+Tomcat+Oracle。并且认为读者已经针对jdk和Tomcat做了正确的开发环境的设置。

2.1准备工作

在%Tomcat%"webapp"依次建立mywebapp,mywebapp"WEB-INF,mywebapp"WEB-INF"lib,把

mondrian.war"WEB-INF"lib"mondrian.jar,javacup.jar, xalan.jar,junit.jar等相关的jar包copy到%TOMCAT_HOME%"webapps"mywebapp"lib"下。

2.2数据库结构

在这个tiny的系统中,数据库有3个表tb_employee(职员表),tb_time(时间表),tb_salary(薪酬表)。表结构如下:

drop table tb_employee;

create table tb_employee

(

employee_id     number,             --职员id

employee_name   varchar2(10)        --职员姓名

);

drop table tb_time;

create table tb_time

(

time_id   number,        --时间id

the_year char(4),       --年

the_month char(2)        --月

);

drop table tb_salary;

create table tb_salary

(

employee_id number,                --职员id

time_id      number,                --时间id

salary       number(19,4)           --薪酬

);

当然,为了使系统能够运行,还需要读者向数据库表中插入一些数据。

2.3根据数据库表的结构,书写schema文件

文件路径为mywebapp"WEB-INF"mondriantest.xml

2.4利用MDX查询

mywebapp"mondriantest.jsp

1

2 Connection connection =

DriverManager.getConnection

("Provider=mondrian;

Jdbc=jdbc:oracle:thin:@xxx.xxx.xxx.xxx:1521:dbname;

JdbcUser=dbuser;

JdbcPassword=dbpasswd;

Catalog=file:///c:/Tomcat4.1/webapps/mywebapp/WEB-INF/mondriantest.xml;

JdbcDrivers=oracle.jdbc.driver.OracleDriver;",null,false);

3 String queryStr=

"select {[Measures].[Salary]} ON COLUMNS,

{[Employee].[employeeId].Members} ON ROWS

from CubeTest ";

4 Query query =connection.parseQuery(queryStr);

5 Result result = connection.execute(query);

out.println("get result");

%>

2.5运行

这时启动tomcat,在浏览器地址栏中输入即可。

三、深入探讨

3.1 API

mondrian为客户端应用程序提供了API接口以进行查询。 而这些API对于任何用过JDBC的人都会觉得似曾相识的。主要的不同点是查询语言的不同:Mondrian用的是MDX('Multi-Dimensional eXpressions'),而JDBC则用的是SQL。

和JDBC一样,也是要经过建立连接,形成查询语句,执行查询得到结果集等几个步骤的。

我们来看看mondriantest.jsp的代码

第1行:import mondrian.olap.*

这是引入我们所需的类,下面要用到的DriverManager、Connection、Query、Result都在这个package内。这个package一般位于mondrian.jar中。

第2行:Connection connection =

DriverManager.getConnection

("Provider=mondrian;

Jdbc=jdbc:oracle:thin:@xxx.xxx.xxx.xxx:1521:dbname;

JdbcUser=dbuser;

JdbcPassword=dbpasswd;

Catalog=file:///c:/Tomcat4.1/webapps/mywebapp/WEB-INF/mondriantest.xml;

JdbcDrivers=oracle.jdbc.driver.OracleDriver;",null,false);

通过DriverManager创建一个Connection的实例,建立起数据库连接。

其中Jdbc=jdbc:oracle:thin:@xxx.xxx.xxx.xxx:1521:dbname; 是设置数据库的ip和库名。JdbcUser=dbuser; 设置数据库用户。JdbcPassword=dbpasswd;   设置用户密码。而

Catalog=file:///c:/Tomcat4.1/webapps/mywebapp/WEB-INF/mondriantest.xml;就是设置MDX语句查询要对应的schema文件的路径

第3行:String queryStr=

"select {[Measures].[Salary]} ON COLUMNS,

{[Employee].[employeeId].Members} ON ROWS

from CubeTest ";

形成MDX的查询语句。MDX语句的形式和schema文件的设定是密切相关的,当然schema文件的形成也是由数据库结构决定的。

第4行:Query query =connection.parseQuery(queryStr);对MDX语句进行分析处理,是否符合schema文件定义、数据库结构和数据库数据。

第5行:Result result = connection.execute(query);执行查询,得到结果集。

我们发现Query类似于JDBC的Statement,而Result则酷似于ResultSet。

3.2 schema

3.2.1什么是schema

schema定义了一个多维数据库。包含了一个逻辑模型,而这个逻辑模型的目的是为了书写MDX语言的查询语句。这个逻辑模型实际上提供了这几个概念:Cubes,维度(Dimensions), 层次(Hierarchies),级别(Levels),和成员(Members)。

而schema文件就是编辑这个schema的一个xml文件。在这个文件中形成逻辑模型和数据库物理模型的对应。

3.2.2 schema的逻辑结构

3.2.2.1 Cube

一个Cube是一系列维度(Dimension)和度量(Measure)的集合区域。在Cube中,Dimension和Measure的共同地方就是共用一个事实表。

例:

…….

3.2.2.2 Measure

一个度量,简单的说,就是要被计算的值。

例:

标签有3个必要的属性name(度量名),column(在事实表中的字段名), aggregation(聚合所用的方法)。

3.2.2.3 Dimenesion

而维度一般有其相对应的维度表。

例:

一般Dimesion包含层次(Hierarchy),而hierarchy是由级别(Level)组成。

标签的foreignKey是事实表中的字段,标签的primaryKey是维度表中的字段,通过这种方式把事实表和维度表关联起来。标签下的

3.3 MDX语言

MDX是为了查询多维数据的,而SQL是为了查询关系数据库的。而Mondrian所涉及到的一些MDX概念、MDX语法以及系统定义的MDX函数和微软的MDX十分接近,差别微小。完全可以参考微软的帮助文档进行学习。在此就不在赘述。MDX语言基本上已成为多维数据库查询语言的标准。

四、结语

Mondrian作为基于java的OLAP引擎,而且是开源的项目,为那些基于java的项目而要脱离微软构架但又不得不对大量数据进行分析的项目又提供了一种可行的方案。希望它也能象蒙得里安·皮特对抽象艺术的发展产生影响一样起到一定的作用。

posted on 2008-04-17 13:29 有猫相伴的日子 阅读(11512) 评论(6)  编辑  收藏 所属分类: BI

mondrian olap 示例_java开源的OLAP引擎--mondrian相关推荐

  1. mondrian olap 示例_详解OLAP概念、基本内容、特点、分类

    概述 OLAP(On-Line Analysis Processing)在线分析处理是一种共享多维信息的快速分析技术:OLAP利用多维数据库技术使用户从不同角度观察数据:OLAP用于支持复杂的分析操作 ...

  2. java开源的规则引擎_Java常用的规则引擎

    概述 在本文中,我们将介绍Java中一些最受欢迎的规则引擎. 规则引擎简介 规则引擎由推理引擎发展而来,是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编 ...

  3. 速度超快!字节跳动开源序列推理引擎LightSeq

    机器之心发布 机器之心编辑部 这应该是业界第一款完整支持 Transformer.GPT 等多种模型高速推理的开源引擎. 2017 年 Google 提出了 Transformer [1] 模型,之后 ...

  4. python开源的人脸识别库_什么是 SeetaFace 开源人脸识别引擎

    区分不同的人是很多智能系统的必备能力.为实现此目的,一种可能的技术手段是通过对人脸的光学成像来感知人.识别人,即所谓的人脸识别技术.经过几十年的研发积累,特别是近年来深度学习技术的涌现,人脸识别取得了 ...

  5. SeetaFace开源人脸识别引擎

    开源网址 目前,SeetaFace开源人脸识别引擎已全部发布在Github上供国内外同行和工业界使用,项目网址为:https://github.com/seetaface/SeetaFaceEngin ...

  6. 7个开源交易撮合引擎

    如果你希望按照自己的需求打造金融交易平台,那么应当选择合适的交易撮合 引擎进行二次开发而不是基于完整的交易平台实现进行修改.本文将介绍 10个采用不同语言开发的开源的撮合引擎,你可以根据自己的需要选择 ...

  7. SeetaFace开源人脸识别引擎介绍

    深度学习大讲堂致力于推送人工智能,深度学习方面的最新技术,产品以及活动.请关注我们的知乎专栏! 区分不同的人是很多智能系统的必备能力.为实现此目的,一种可能的技术手段是通过对人脸的光学成像来感知人.识 ...

  8. 记录一下八款开源 Android 游戏引擎

    记录一下八款开源 Android 游戏引擎 虽然android学了点点,然后现在又没学了(我为啥这么没有恒心呢大哭).以后有时间还是要继续学android的,一定要啊!虽然现在没学android游戏编 ...

  9. 采用Excel作为设计器的开源中国式报表引擎:NopReport

    中国式报表是复杂结构报表的代名词,它泛指国内信息化领域经常出现的基于多源数据,采用行列交叉.多层级表头.自由分片合并等形式所展现的信息汇总报表. 为什么会存在"中国式报表"这一说法 ...

最新文章

  1. oracle网站注入,oracle注入,utl_http方法
  2. 坐在隔壁的00后同事,让我看到了职场“反内卷”的希望
  3. openfiler setup一,安装
  4. (原創) 將map輸出到cout,是否有更方便的方法? (C/C++) (STL)
  5. 你写的 Python 代码可以更“瘦”
  6. 继续教育计算机组成原理a试卷,计算机组成原理模拟试题及答案西工大.doc
  7. java创建对象的几种方式
  8. linux运维、架构之路-nfs网络文件系统
  9. c语言贪心算法合并箭,贪心算法:用最少数量的箭引爆气球
  10. 数据库--开发一个房产信息系统实现居民房产信息管理
  11. nodejs生成pdf文件
  12. Java 从入门到放弃?
  13. [神经网络]计算量GFLOPS和参数量#Params以及感受野计算
  14. ntds(600)ntdsa:系统错误1453配额不足及恢复过程记录
  15. Android源码阅读记录
  16. 信息安全从业者书单推荐(2020.6.28更新)
  17. 数学建模----LaTex排版使用速成
  18. Android命令-重点命令-pm/am/content/wm/appops
  19. xls和xlsx的区别
  20. 脚本显示服务器超时,服务器诡异的请求超时问题

热门文章

  1. 你好2017! 再见2015, 再见小码哥!
  2. 原画零基础入门——人体结构基础篇
  3. azure虚拟服务器,Azure 虚拟机价格详情_预算 - Azure 云计算
  4. 上海应用技术大学计算机证书查询,恭喜你已被上海应用技术大学录取!上应大录取查询方式、录取进程都在这里啦!...
  5. 谷歌seo快速排名优化方法,谷歌seo需要哪些技术手段?
  6. ASL吐血整理数据结构查找
  7. ansible剧本(playbook)
  8. 达之云牵手杭州数梦联合启动智慧矿业大数据服务项目
  9. 智能手机背后隐藏的第二系统——RTOS
  10. 如何熟练使用PPT?7大妙招助你升职加薪