Cube和Cuboid

有了维度跟度量,一个数据表或者数据模型上的所有字段就可以分类了,它们要么是维度,要么是度量(可以被聚合)。于是就有了根据维度和度量做预计算的Cube理论。

给定一个数据模型,我们可以对其上的所有维度进行聚合,对于N个维度来说,组合的所有可能性共有2n种。对于每一种维度的组合,将度量值做聚合计算,然后将结果保存为一个物化视图,称为Cuboid。所有维度组合的Cuboid作为一个整体,称为Cube。

下面举一个简单的例子说明,假设有一个电商的销售数据集,其中维度包括时间[time]、商品[item]、地区[location]和供应商[supplier],度量为销售额。那么所有维度的组合就有24 = 16种,如下图所示:

一维度(1D)的组合有:[time]、[item]、[location]和[supplier]4种;

二维度(2D)的组合有:[time, item]、[time, location]、[time, supplier]、[item, location]、[item, supplier]、[location, supplier]3种;

三维度(3D)的组合也有4种;

最后还有零维度(0D)和四维度(4D)各有一种,总共16种。

注意:每一种维度组合就是一个Cuboid,16个Cuboid整体就是一个Cube。

大数据培训技术 Cube和Cuboid相关推荐

  1. 深圳大数据培训技术分享:Hadoop集群同步

    深圳大数据培训技术分享:Hadoop集群同步 分享--是技术突飞猛进的很好体验!在千锋学习大数据技术,开始学会了分享,班里五十个人,每个人就能得到49份不同技术探讨.每次到分享的时刻,总会收获不同的想 ...

  2. 大数据培训技术之ClickHouse

    大数据培训技术之ClickHouse概述 1.1 什么是ClickHouse ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLA ...

  3. 大数据培训技术logstsh filter

    logstsh filter Filter是logstsh功能强大的原因,它可以对数据进行丰富的处理,比如解析数据.删除字段.类型转换等 date:日期解析 grok:正则匹配解析 dissect:分 ...

  4. 大数据培训技术使用spark对phoenix的读写

    使用spark对phoenix的读写 在Phoenix中查看数据 select * from STOCK_SYMBOL 如下显示: 在Hbase中查看数据 scan "STOCK_SYMBO ...

  5. 大数据培训技术phoenix表操作

    phoenix表操作 1 显示所有表 !table 或 !tables 2 创建表 CREATE TABLE IF NOT EXISTS us_population ( State CHAR(2) N ...

  6. 大数据培训技术Kibana

    Kibana 1.Kibana安装 [root@localhost kibana]# tar -zxvf kibana-6.3.1-linux-x86_64.tar.gz [root@localhos ...

  7. 大数据培训技术:DataSet介绍

    DataSet DataSet是具有强类型的数据集合,需要提供对应的类型信息. 1 创建 1)创建一个样例类 scala> case class Person(name: String, age ...

  8. 大数据培训技术Elasticsearch集群健康

    集群健康 在Elasticsearch集群中可以监控统计很多信息,但是只有一个是最重要的:集群健康(cluster health).集群健康有三种状态:green.yellow或red. 在一个没有索 ...

  9. 好程序员大数据培训技术分享:Hadoop集群同步

    为什么80%的码农都做不了架构师?>>>    好程序员分享:Hadoop集群同步分享--是技术突飞猛进的很好体验!在好程序员学习大数据技术,开始学会了分享,班里五十个人,每个人就能 ...

最新文章

  1. 阿里云服务器CentOS7版本yum方式安装mysql
  2. 【运筹学】匈牙利法 ( 克尼格定理 | 匈牙利法引入 )
  3. s6-9 TCP 定时器
  4. python随机抽取人名_python的random
  5. 如何匹配两段文本的语义?
  6. 作者:马浚诚(1987-),男,中国农业科学院农业环境与可持续发展研究所助理研究员。...
  7. Java关键字volatile
  8. 分治算法-最大子数组问题
  9. 安装k8s,高可用3 master安装脚本
  10. 《迅雷链精品课》第九课:区块链 P2P 网络
  11. 摄影曝光口诀_摄影中的“向右曝光”是什么以及为什么要这么做
  12. 三国演义人物关系分析大纲
  13. 今年过年不送礼,送礼就送......
  14. sqoop 导出hive数据到MySQL数据库当中
  15. Python2.7字符编码详解
  16. python2/3 opencv的fitline函数
  17. SSMS错误代码大全
  18. 这可能是前端开发中能遇到最全的cookie问题了
  19. 嵌入式Linux驱动学习【8】—— Nand Flash
  20. 《那些年啊,那些事——一个程序员的奋斗史》——103

热门文章

  1. 【Leetcode刷题】:Python:494. 目标和
  2. LabVIEW控制Arduino实现PWM呼吸灯(基础篇—5)
  3. java线程学习,GitHub - zksir/thread: Java多线程学习
  4. CSS3实现页面灰白效果
  5. 飞控地面站MissionPlanner界面修改------MainV2界面添加控件并动态刷新数据
  6. Git使用命令(超详细)
  7. 初入神经网络剪枝量化4(大白话)
  8. 当地图变成“元宇宙”入口, 高德 “钱途”更广了
  9. 算法设计与分析: 4-27 登山机器人问题
  10. CSP 201912-1 报数