数据仓库-OLAP操作
数据仓库-OLAP操作索引
- Drill down
- Roll-up or Drill-up
- Drill across
- Slice and Dice
- Moving Sum
- Rank
- Pivot
- Cross Tab
Drill down
- 显示细节
- 也可以理解为:数据纬度向细粒度化方向的移动 e.g. 从“华北地区”到“山东省”再到“济南市”的过程
Roll-up or Drill-up
- 删去细节
- 类似于一个“集成”和生成摘要的过程。
- 它是Drill down 的逆操作
Drill across
- 常用于星型结构的数据库,这里并不改变数据的粒度,而是从不同的纬度来分析事实表。但注意维表是相同的,只是可能有多个事实表。
- 上面说的有些抽象,举个例子:一家淘宝店,对于相同的维表,抽取每个星期的销售量和每个星期的发货量,使用的就是drill across的操作。
Slice and Dice
- Slice 英文有“切片”的含义,这里指的是类似于投影的操作。 通过Slice操作我们可以将多维数据进行降维。我们在对数据库进行查询的时候通常使用where 语句来进行投影Slicing。
- Dice 英文有“小块”的意思,他和slice的区别是该操作并不会对事实表的纬度进行改变,而Slice操作往往减少了事实表的纬度。可以看成一个取行的行为。
- 具体的可以看下面的两个例子来体会:
Moving Sum
- 这是一个“滑动”平滑的一个常见方法
Rank
- Rank 可根据一些准则对于数据进行排序
- 一些例子有:
- Top(n)取最高的n个数据,
- Bottom(n)取最低的n个数据,
- Below取低于某个数值的所有数据,
- Tripartite 将数据分成 high medium low 三组,一般先对所有数值进行rank,之后再将他们分类
- 还有类似Quartering等。
Pivot
- Pivot数轴量 会根据维度属性值将结果重新组织
- 主要用于前端展示时
- 这里是一个例子,
Cross Tab
- Cross-tabulation 交叉表
- Cross Tab 是它的简写
- 也称作“Pivot tables”
- 常用于电子表单
- 将数据以2维的形式展示
- 其他的纬度通过“Aggregate”的方式进行聚合
- 常见的聚合方式是求和 即含有“sub totals”的纬度属性
- 常用的操作
- Roll up 删去细节 更多的聚合 futher aggregation
- Drill down 更多的细节 更少的聚合 less aggregation
数据仓库-OLAP操作相关推荐
- saiku+kettle整合(六)olap操作
title: saiku+kettle整合(六)olap操作 tags: categories: saiku date: 2016-08-25 18:18:54 使用saiku可以对应使用相关olap ...
- 【DBMS 数据库管理系统】数据仓库 ( 数据仓库简介 | 操作型数据与分析性数据对比 | 数据仓库特征 | 特征一 : 面向主题组织数据 | 面向应用 | )
文章目录 一.数据仓库简介 二.操作型数据与分析型数据对比 三.数据仓库 特征 与 定义 四.特征一 : 面向主题 数据组织方式 五.面向应用 数据组织方式 六.面向主题 组织数据 七.数据 从 面向 ...
- 数据仓库 OLAP
一.数据库 vs. 数据仓库 1. 构建目的不同:数据库主要用于实现企业的日常业务管理,提高业务运营的效率 数据仓库用于将多个数据源的数据进行集成,用于分析,结果辅助决策 2. 管理数据不同:数据库通 ...
- 【自建分布式数据库详细指南】(四)设计:CITUS分布式数据仓库OLAP/OLTP的架构选择及PG数据库优化方法策略
关于数据库的整体设计,很少有书籍专门试讲,因为这需要博大精深的理论水平以及阅历丰富的工作经验,但往往这两者不可兼得,在设计数据库时需要考虑多方面的因素,如需求,数据体量,数据库架构,硬件环境,成本.这 ...
- hive olap 数据仓库_数据仓库系统的实现和使用(含OLAP重点讲解)
前言 完整的数据仓库系统会涉及其他一些组件的开发,其中最主要的是ETL工程,在线分析处理工具(OLAP)和商务智能(BI)应用等. 本文将对这些方面做一个总体性的介绍(尤其是OLAP),旨在让读者对数 ...
- 数据仓库的ETL、OLAP和BI应用
文 | 穆晨 ▍创建数据仓库 数据仓库的创建方法和数据库类似,也是通过编写DDL语句来实现.在过去,数据仓库系统大都建立在RDBMS上,因为维度建模其实也可以看做是关系建模的一种.但如今随着开源分布式 ...
- 数据挖掘与数据仓库——数据仓库、 OLAP及数据立方体计算
数据仓库. OLAP及数据立方体计算 什么是数据仓库 有多种但并不严格的定义 与操作数据库相隔离并单独维护的一个用来支持决策过程的数据库. 一个用来对整理过的历史数据进行分析以便支持信息处理的固定平台 ...
- olap 多维分析_OLAP(在线分析处理)| OLAP多维数据集和操作
olap 多维分析 In the previous article of OLAP, we have seen various applications of OLAP, Various types ...
- 大数据多维分析常用操作图解 OLAP Operations
多维数据模型中的 OLAP 操作 OLAP Operations in the Multidimensional Data Model 在多维模型中,记录被组织成不同的维度,每个维度包括由概念层次结构 ...
最新文章
- 可用性追踪是虚拟化网络的关键
- 用lambda对std::list排序 - 力为的技术博客 - C++博客
- 2018这一年或平淡或不凡,2019看更大的世界
- redis 数据类型、命令
- pycharm 如何使用git链接到github实现代码提交
- java 网站计数器_Java Bean实现网页来访计数器
- mariadb mysql同步_MySQL(Mariadb)主从同步基础
- myeclipse8.5打包jar并引入第三方jar包
- c++ 类和对象的内存管理
- elementui的css文件没有引入_为什么每个React组件都需要引入React?
- Netty-1-一个简单的服务器实例
- 微软拒绝修复滥用 MSTSC 的安全绕过缺陷
- firebug 调试
- 学历查询和专业代码查询
- 【Kaggle Quick, Draw!】涂鸦识别,AI与你同在
- opencv 之 颜色通道提取
- GoogleStyle编程代码规范
- leafy tree
- 2021年N1叉车司机新版试题及N1叉车司机证考试
- windows无法连接到某个wifi_Win7系统提示Windows无法连接到无线网络如何解决?