很久没看模型方面的理论知识,最近3年在互联网公司琢磨前行,遇到了很多坑和自我否定或迷惑的状态。就多维模型来说,被传统行业洗礼,还有误人子弟的网上文章和CUBE工具,把kimball带入了一个万劫不复的误区。我是幸运的,而且逃离了这个误区。接下来讲解一下我亲身经历的(Raph总结的)四大误区:

一、维度模型只包含汇总数据

原因:完全是被某些cube工具带偏了对kimball的理解。如Kylin, 只能选择5~10个维度构建cuboid。
事实上,多维模型首先是把某个业务过程,基于最细粒度构建维度化模型。互联网数仓常用的大宽表,一般采用这个方式构建维度公共层模型。
怎么能说它只包含汇总数据呢?

二、维度模型是部门级,不是企业级模型

原因:很多项目采用Inmon构架基础数据层,然后构建多维数据集市。导致很多码农以为,维度模型仅仅适用于某个部门的产品需求。
事实上,多维模型是围绕企业总线架构和价值链的业务过程来构建,构建星型或雪花型维度化模型。比如总线矩阵,主题宽表层,就是面向企业级。

三、维度模型不可扩展,或扩展性差

原因:维度模型只能装有限少量维度的汇总数据,一旦迭代维度,模型就需要重构和预计算数据。
事实上,给终端用户报表的汇总数据,属于聚集事实表,这很不容易扩展。聚集事实表,衍生于最细粒度构建的维度模型。如果说模型不可扩展,或数据量必须有限,那就是设计者的建模理论缺乏导致。

四、维度模型仅用于预测或无法适应业务变化

原因:很多算法工程师,总是基于汇总的数据做模型演练和机器学习。一旦迭代,他们就得重新去取数,构建数据集。
事实上,构建最细粒度的、高内聚低耦合的维度模型,非常容易扩展,并且主动拥抱迭代。

希望此文,对迷途中的你有所帮助。

Kimball多维模型的四大误解相关推荐

  1. ssas 面试题_多维模型的SSAS面试问题

    ssas 面试题 介绍 (Introduction) SSAS interview questions is a new article for people looking for SSAS job ...

  2. MSBI表格模型与多维模型比较

    MSBI表格模型与多维模型比较 1.表格模型与多维模型是ssas服务下的两个不同产品 2.它们不能直接相互转换 表格模型 1.表格模型的表之间的关系只能是一对多并且只允许单列关联, 没有一对一或者多对 ...

  3. 马毅:低维模型与深度模型的殊途同归(神经网络、压缩感知和低秩分解与补全)

    机器之心原创 作者:邱陆陆 上周,今日头条人工智能实验室在清华大学举办了第二期 AI 技术沙龙,邀请到上海科技大学信息科学与技术学院的马毅教授带来题为「高维数据的低维结构与深度模型」的主题分享.马毅教 ...

  4. 将机器人3维模型导入至V-rep仿真软件的方法小结

    相关博客 在V-rep中通过D-H参数自动生成机械臂模型:https://blog.csdn.net/DoctorSRn/article/details/106852312 前言 首先介绍本篇博客的背 ...

  5. UC伯克利马毅七年力作!700页新书探究低维模型与高维数据分析

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要5分钟 Follow小博主,每天更新前沿干货 近日,加州伯克利电气工程与计算机科学系马毅(Yi Ma)教授宣布其与哥大电气工程系副教授John ...

  6. 马毅:低维模型与深度模型的殊途同归

    作者:邱陆陆 上周,今日头条人工智能实验室在清华大学举办了第二期 AI 技术沙龙,邀请到上海科技大学信息科学与技术学院的马毅教授带来题为「高维数据的低维结构与深度模型」的主题分享.马毅教授以计算机视觉 ...

  7. labview调用solidworks3维模型

    上一篇介绍了solidworks3维模型的建立,本篇将介绍labview调用solidworks3维模型的流程: 保存 格式 要求: LabVIEW 软件支持调用3 种格式的三维模型文件,分别为ASE ...

  8. pytorch2维模型转换为3维模型,并使用2维模型参数初始化3维模型——以resnext为例

    pytorch2维模型转换为3维模型--以resnext为例 2D网络结构转换到3D网络结构 Inflate 初始化3D网络的参数 完整结构主要分为2步骤 2维resnext网络结构 3维resnex ...

  9. 2维照片生成3维模型_如何使用2维模型跟踪状态

    2维照片生成3维模型 Application databases are generally designed to only track current state. For example, a ...

最新文章

  1. Python:Scrapy实战项目手机App抓包爬虫
  2. 2019年中国重点大学排名发布,北大第1,清华第2,浙大第5
  3. 【模拟退火】解决【TSP】问题
  4. 使用内置函数操作数据库
  5. python写前端代码_python学习之路前端-JavaScript
  6. 重磅!普惠AI--华为云语音语义万次调用1元购,有奖问答@评论区等你来!
  7. 【Arduino】OTTO机器人(做二次开发的一点点总结)
  8. 正则表达式匹配日期时间
  9. VBA 打开 Debug窗口 进行调试 (同时可以查看debug操作对应的快捷键)
  10. 用anaconda配置深度学习的环境,从配置环境到下载各种包,绝对学会,还是没学会留下评论,我看到会回答
  11. 2012r2备域控服务器搭建,Windows Server 2012 R2域控制器部署
  12. 怎么把GIF动图转成JPG图片
  13. 关键时刻救一命:旧手机改造求生工具
  14. java 三阶幻方编程_巧解三阶幻方
  15. 趣味小问题2——规律型勾股数
  16. 沈阳市房地产市场信息系统数据容灾与异地备份
  17. THREEJS辉光与景深特效
  18. 豆豉烘干技巧有哪些,只用下列步骤烘干就行了
  19. 对于深度与广度的思考
  20. Eclipse详细安装教程(win10)

热门文章

  1. 计蒜客2018蓝桥杯省赛 B 组模拟赛(一)——H:封印之门
  2. XListView-Android-master添加startRefresh方法
  3. 理解overflow
  4. SQLite使用drop column删除表字段
  5. RPA应用场景-财务报表统计整合
  6. 2022最新自动化测试面试题精选
  7. 大数据告诉你英语绝不是废物技能——王思聪手撕花千芳撕对了
  8. 元境亮相进博会 携手Unity共同赋能开发者云端创作力
  9. 【Java基础】属性编辑器PropertyEditor
  10. rust全息要啥才能做_绝地求生玩家意外发现红点秘密,网友表示以后终于不用带全息了!...