一、维度建模分为两种表

  1. 事实表
    存在这样一些数据,如行为记录,操作记录,订单,日志等,都可以作为事实表
    特点:每条数据都有一个唯一键,数据通常来说不会更新,随着时间的增加而增加
  2. 维度表
    维度表是分析数据角度的信息表,如商家信息,地区信息,用户信息为角度存储的表,适合经常更新,一般和事实的关系是一对多

二、维度建模三种模型:

  1. 星型模型
  2. 雪花模型
  3. 星座模型
说明:

1). 星型模型
以事实表为中心,所有的维度表直接连在事实表上,比较常用的一种形式。这样维度加事实的结构即便于维度数据(少数据量)更新,又能够满足自由组合满足不同的分析维度

如上图所示:

  1. 产品表与部门表,会存在更新现象,而事实表,一般只存储部门ID,产品ID,在需要的时候再进行关联
  2. 这样的结构能够以部门的维度做数据分析,如统计某部门的销售金额,亦能够以产品的角度分析某个产品的销售总额,能够灵活的以不同角度分析和查看数据

2). 雪花模型
雪花模型指的是在星型模型的基础上,维度表再关联维度表,这种结构应该在OLTP场景下会用这样的结构,在数仓下基本没人使用。如果业务数据存储为这样的结构,常常将数据打平,即合并成一张维度表,这样它将会上级为星型模型。之所以如此是为了减少表连接查询的性能开销和维护的复杂程度,雪花模型如下:

2). 星座模型
在实际业务中,星座模型才是数仓建设的最终归属,它也是建立在星型模式下,不同的是只是和其他事实表共享了维度表,即存在多张事实表,共享一张维度表的情况

kimball 维度建模,星型和星座 模型核心在于将事实表(过程数据通常不变的数据)与主体信息表(常更新的数据,有维度信息)逻辑进行拆分。 实现任意维度分析的需求下,减少表连接查询的深度,这也是市面上常见的数仓建设理论

Kimball 维度建模理论相关推荐

  1. 数仓实践:浅谈 Kimball 维度建模

    我们不管是基于 Hadoop 的数据仓库(如 Hive ),还是基于传统 MPP 架构的数据仓库(如 Teradata ),抑或是基于传统 Oracle .MySQL .SQL Server 关系型数 ...

  2. 【Kimball维度建模】+【阿里巴巴中台—OneData实施】

    一.Kimball维度建模 1.前生今世 维度建模出自Ralph Kimall的<The DataWarehouse Toolkit-The Complete Guide to Dimenson ...

  3. (转载)通俗易懂数仓建模—Inmon范式建模与Kimball维度建模

    在数据仓库领域,有两位大师,一位是"数据仓库"之父 Bill Inmon,一位是数据仓库权威专家 Ralph Kimball,两位大师每人都有一本经典著作,Inmon大师著作< ...

  4. Kimball 维度建模技术 (1)

    Kimball 维度建模技术(1) 1 事实表技术基础 1.1 事实表结构 发生在现实世界中的操作型事件,其所产生的可度量数值,存储在事实表中. 从最低的粒度级别来看,事实表行对应一个度量事件. 因此 ...

  5. Kimball维度建模基本理论

    本文相关基本理论摘录自<数据仓库工具箱–维度建模的完全指南-第二版>和<数据仓库声明周期工具箱> 维度建模介绍 维度建模是一种将数据结构化的逻辑设计方法,将客观世界划分为度量和 ...

  6. Inmon 范式建模与 Kimball 维度建模

    一.两种建模思想 对于 Inmon 和 Kimball 两种建模方式可以长篇大论叙述,但理论是很枯燥的,尤其是晦涩难懂的文字,大家读完估计也不会收获太多,所以笔者根据自己的理解用通俗的语言提炼出最核心 ...

  7. 通俗易懂数仓建模—Inmon范式建模与Kimball维度建模

    在数据仓库领域,有两位大师,一位是"数据仓库"之父 Bill Inmon,一位是数据仓库权威专家 Ralph Kimball,两位大师每人都有一本经典著作,Inmon大师著作< ...

  8. 数据仓库专题(2)-Kimball维度建模四步骤

    一.前言 四步过程维度建模由Kimball提出,可以做为业务梳理.数据梳理后进行多维数据模型设计的指导流程,但是不能作为数据仓库系统建设的指导流程.本文就相关流程及核心问题进行解读. 二.数据仓库建设 ...

  9. Kimball维度建模

    维度模型是数据仓库领域大师Ralph Kimball 所倡导,以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,所以它重点解决用户如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性 ...

最新文章

  1. hadoop2 自定义OutputFormat场景杂记
  2. 天才少年何恺明:高考状元的开挂人生
  3. AT2667-[AGC017D]Game on Tree【SG函数】
  4. 两个map中的数据,按照相同键,将所对应的值相加方法
  5. Jsp和Servlet有什么区别?
  6. 光缆弹性模量计算_光缆的制造、种类、施工、选用方法(超全)
  7. 剑指Offer(java版):字符串的排列
  8. iMazing2注册机如何备份苹果手机的通话记录?
  9. 隐马尔可夫模型python_机器学习中的隐马尔科夫模型(HMM)详解
  10. js高级学习笔记-14-从函数运行和内存角度理解闭包
  11. 带通滤波器的设计概述
  12. 三本毕业,三年嵌入式软件的心路历程
  13. oracle数据泵PARALLEL,EXPDP的parallel参数
  14. 使用vscode编写html代码
  15. word文档如何排版图片
  16. body加背景图片没反应_body背景图片,给body加背景图片
  17. Python数据分析与可视化概述
  18. 攻防世界——MISC--练习区解题步骤(持续更新)
  19. 【转】指定页面进行Monkey测试
  20. 三星a7108android 7.0,三星A7108解锁教程 三星A7108解锁Bootloader

热门文章

  1. django-simple-captcha验证码的验证问题
  2. RabbitMQ——使用Exchange中的fanout交换机实现消息发送和接收
  3. windows系统下部署单点登录系统
  4. 计算机word 2010版,Word 2010 用户入门
  5. 介绍数据库中的wal技术_SQLite中的WAL机制详细介绍
  6. 杂谈:iphone 4s 会登陆中低端市场吗?
  7. JZOJ 初中 2184:羊羊列队
  8. ie浏览器提示缺少标识符_IE11和神秘的缺少浏览器模式
  9. 测试人员如何保证测试质量
  10. opencv读取图片cv2格式转换