大数据培训技术 Cube和Cuboid
Cube和Cuboid
有了维度跟度量,一个数据表或者数据模型上的所有字段就可以分类了,它们要么是维度,要么是度量(可以被聚合)。于是就有了根据维度和度量做预计算的Cube理论。
给定一个数据模型,我们可以对其上的所有维度进行聚合,对于N个维度来说,组合的所有可能性共有2n种。对于每一种维度的组合,将度量值做聚合计算,然后将结果保存为一个物化视图,称为Cuboid。所有维度组合的Cuboid作为一个整体,称为Cube。
下面举一个简单的例子说明,假设有一个电商的销售数据集,其中维度包括时间[time]、商品[item]、地区[location]和供应商[supplier],度量为销售额。那么所有维度的组合就有24 = 16种,如下图所示:
一维度(1D)的组合有:[time]、[item]、[location]和[supplier]4种;
二维度(2D)的组合有:[time, item]、[time, location]、[time, supplier]、[item, location]、[item, supplier]、[location, supplier]3种;
三维度(3D)的组合也有4种;
最后还有零维度(0D)和四维度(4D)各有一种,总共16种。
注意:每一种维度组合就是一个Cuboid,16个Cuboid整体就是一个Cube。
大数据培训技术 Cube和Cuboid相关推荐
- 深圳大数据培训技术分享:Hadoop集群同步
深圳大数据培训技术分享:Hadoop集群同步 分享--是技术突飞猛进的很好体验!在千锋学习大数据技术,开始学会了分享,班里五十个人,每个人就能得到49份不同技术探讨.每次到分享的时刻,总会收获不同的想 ...
- 大数据培训技术之ClickHouse
大数据培训技术之ClickHouse概述 1.1 什么是ClickHouse ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLA ...
- 大数据培训技术logstsh filter
logstsh filter Filter是logstsh功能强大的原因,它可以对数据进行丰富的处理,比如解析数据.删除字段.类型转换等 date:日期解析 grok:正则匹配解析 dissect:分 ...
- 大数据培训技术使用spark对phoenix的读写
使用spark对phoenix的读写 在Phoenix中查看数据 select * from STOCK_SYMBOL 如下显示: 在Hbase中查看数据 scan "STOCK_SYMBO ...
- 大数据培训技术phoenix表操作
phoenix表操作 1 显示所有表 !table 或 !tables 2 创建表 CREATE TABLE IF NOT EXISTS us_population ( State CHAR(2) N ...
- 大数据培训技术Kibana
Kibana 1.Kibana安装 [root@localhost kibana]# tar -zxvf kibana-6.3.1-linux-x86_64.tar.gz [root@localhos ...
- 大数据培训技术:DataSet介绍
DataSet DataSet是具有强类型的数据集合,需要提供对应的类型信息. 1 创建 1)创建一个样例类 scala> case class Person(name: String, age ...
- 大数据培训技术Elasticsearch集群健康
集群健康 在Elasticsearch集群中可以监控统计很多信息,但是只有一个是最重要的:集群健康(cluster health).集群健康有三种状态:green.yellow或red. 在一个没有索 ...
- 好程序员大数据培训技术分享:Hadoop集群同步
为什么80%的码农都做不了架构师?>>> 好程序员分享:Hadoop集群同步分享--是技术突飞猛进的很好体验!在好程序员学习大数据技术,开始学会了分享,班里五十个人,每个人就能 ...
最新文章
- 阿里云服务器CentOS7版本yum方式安装mysql
- 【运筹学】匈牙利法 ( 克尼格定理 | 匈牙利法引入 )
- s6-9 TCP 定时器
- python随机抽取人名_python的random
- 如何匹配两段文本的语义?
- 作者:马浚诚(1987-),男,中国农业科学院农业环境与可持续发展研究所助理研究员。...
- Java关键字volatile
- 分治算法-最大子数组问题
- 安装k8s,高可用3 master安装脚本
- 《迅雷链精品课》第九课:区块链 P2P 网络
- 摄影曝光口诀_摄影中的“向右曝光”是什么以及为什么要这么做
- 三国演义人物关系分析大纲
- 今年过年不送礼,送礼就送......
- sqoop 导出hive数据到MySQL数据库当中
- Python2.7字符编码详解
- python2/3 opencv的fitline函数
- SSMS错误代码大全
- 这可能是前端开发中能遇到最全的cookie问题了
- 嵌入式Linux驱动学习【8】—— Nand Flash
- 《那些年啊,那些事——一个程序员的奋斗史》——103
热门文章
- 【Leetcode刷题】:Python:494. 目标和
- LabVIEW控制Arduino实现PWM呼吸灯(基础篇—5)
- java线程学习,GitHub - zksir/thread: Java多线程学习
- CSS3实现页面灰白效果
- 飞控地面站MissionPlanner界面修改------MainV2界面添加控件并动态刷新数据
- Git使用命令(超详细)
- 初入神经网络剪枝量化4(大白话)
- 当地图变成“元宇宙”入口, 高德 “钱途”更广了
- 算法设计与分析: 4-27 登山机器人问题
- CSP 201912-1 报数