用信息来支持更有事实依据的决策制定过程。
业务人员复杂的思考过程   能在系统上直观的通过数据、比大小的方式判断 (政企圈的号码识别(可能会考虑很多情况)最后给个指数)
数据内容在标识方面应该是见名知义
对仓库中的数据进行切割处理的分离与合并操作
操作数据的存储(ODS,Operational Data Store)
事实表 
富有意义的业务描述符号的使用,减少出现误解的可能性
操作编码通常包含一些信息在里面,比如,开头两位数字可能标识业务行业,而另外两位数字可能标识地域分布。
取出含义并容易用来进行过滤、成组或者形成报表的分开的维度属性形式提供给用户。
维度表时常描述业务中的层次关系。
粒度就是同一维度下,数据的粗细程度,如果对粒度方面的内容很清楚,那么维度的确定就很容易了 
四步维度设计过程:
1、选取要建模的业务处理过程
2、定义业务处理的粒度
3、选定用于每个事实表行的维度
4、确定用于形成每个事实表行的数字型事实
原子型数据是所收集的最详细的信息,这样的数据不能再做进一步的细分。
应优先考虑为业务处理获取最有原子性的信息而开发维度模型。
数据仓库几乎总是要求在每个维度可能得到的最低粒度上对数据进行表示的原因,并不是因为查询想看到每个低层面的行,而是因为查询希望以精确的方式对细节知识进行抽取。
原子型数据可为分析方面提供最大限度的灵活性,因为它可以接受任何可能形式的约束,并可以以任何可能的形式出现。
维度模型的细节性数据是基本不变的
销售面积是商场的一个不变属性,并且作为报表约束或者行标题使用的情况比用做求和的可加分量要多得多。
因为这些原因,可以确信销售面积是属于商场的维度表。
必须避免在事实表中出现空关键字,在这方面显得比较合适的设计师在对应的维度表中包括一行来标识该维度对度量值不可用。
赞成将四个维度糅合在一起,基于如下考虑:
1、既然四个因果机制是高度相关的,那么组合起来的单个维度就不会比分开的任何一个大许多;
2、组合起来的单个维度能够高效地进行浏览,以弄清各种不同的价格降低、广告、展销与优惠券是如何在一起应用的。
在维度表中所进行的浏览,并不能解释促销对哪家商场和哪种产品产生了影响,这类信息放在事实表中。
赞成四个维度分开,基于如下考虑:
1、在用户分开考虑这些机制时,分开的维度对业务群体来说更容易理解。这一点在业务需求调研期间就会暴露出来。
2、独立维度的管理相对组合维度管理,表现的更加直接了当。以后如果新增了其他维度,比较方便。
非事实型事实表:不具有度量指标,仅仅能够捕获所涉及的关键字之间的关系;
什么产品属于促销之列却没有卖出?1:某天促销产品的范围;2:销售事实表确定卖出了什么产品
退化的事务编号维度:比如POS事务编号这样的固有操作型票据编号,应该自然而然地放在事实表中,而不用连接到维度表。
退化维度在事实表粒度表示单个事务或者事务分列项目时是很常见的,因为它表示了父实体的唯一标识符。
当形成的单个新维度比分开的维度的笛卡尔积显著地小,那么意味着对维度合成方式的选取是适当的。
●维度表的规范化会增加维度表或子维度表的数量,在查询数据时需要更多的外键联合,因此会降低查询性能。
●雪花模式实现维度表的规范化,有利于节省空间。
●由于维度表与子维度表存在多重联合,所以雪花模式查询比星形模式查询更复杂。
●对于使用数据仓库系统的业务用户而言,使用雪花模式的难度更大,因为他们操作的数据库表比星形模式多。
●创建汇总表,并将它(们)与相应的维度表建立联合,可以减少执行时间,提高查询性能。
存在特别多的维度一般都预示了不同维度并不是完全独立的,而应该组合成单个维度这样的一个迹象。
将体系的元素在事实表中表示成分开的维度,是维度建模方面的一种错误做法。
要避免在数据仓库关键字中包括带有技巧性的内容,查询和数据存取应用都不应该在关键字上存在内置的相关性,因为这样的逻辑容易变得无效。
数据仓库中维度和事实表之间的每个连接都应该没有明确含义的整形代理关键字来建立。
page85

【读书笔记】数据仓库工具箱 维度建模指南相关推荐

  1. 数据仓库工具箱维度建模权威指南-第一章 数据仓库、商业智能及维度建模初步

    数据仓库和商业智能(Data Warehousing and Business Intelligence, DW/BI),DW/BI 系统的数据结构与标识必须符合业务用户的思维过程和词汇 信息两个目的 ...

  2. 漫谈数据仓库之维度建模

    2019独角兽企业重金招聘Python工程师标准>>> 0x00 前言 下面的内容,是笔者在学习和工作中的一些总结,其中概念性的内容大多来自书中,实践性的内容大多来自自己的工作和个人 ...

  3. 数据建模_漫谈数据仓库之维度建模

    点击上方蓝色字体,选择"设为星标" 回复"资源"获取更多惊喜 大数据技术与架构点击右侧关注,大数据开发领域最强公众号! 大数据真好玩点击右侧关注,大数据真好玩! ...

  4. 数据仓库Kimball维度建模技术精华

    一.什么是事实表 1.1事实表概念 事实表用来表示业务度量,事实表的每行代表一个度量事件.例如商品订单表的一行,代表单个用户下单的一个状态. 1.2.行设计原则 第一原则:每行中的数据是一个特定级别的 ...

  5. 【计算机网络】读书笔记之《HTTP权威指南》

    HTTP协议是非常重要的应用层协议,有很多应用都是基于它构建,比如web浏览器.服务器等等,因此我们很有必要去深入学习它.<权威HTTP指南>整本书穿插了很多的图片,所以理解起来相对其他书 ...

  6. 读书笔记:《敏捷实践指南》

    <敏捷实践指南> 项目管理协会和敏捷联盟®特许编写本实践指南,目的是在社区内建立对敏捷方法的更深入的理解.本实践指南的愿景是:为项目团队提供相关工具.针对不同情境的指导方针以及对目前敏捷技 ...

  7. 读书笔记《高性能网站建设指南:前端工程师技能精髓》

    只有10-20%的最终用户响应时间花在了下载HTML文档上.其余的80-90%时间花在了下载页面中的所有组件上. 规则1.减少HTTP请求 图片地图:将多个图片合并成一个,而后通过css定位显示不同的 ...

  8. 读书笔记-Office 365开发入门指南

    作者博客 Office 365 开发概览系列 - 随笔分类 - 陈希章 - 博客园  https://www.cnblogs.com/chenxizhang/category/967796.html ...

  9. 读书笔记:《债券投资完全指南》

    了解债券风险,避免自认为没有风险实际上只是风险因素未知. 寻找存在机会的债券领域 了解足够的技术信息和可靠的分析 知道如何获取信息 文章目录 一.债券基础 1. 债券:基础 2. 债券:市场 3. 债 ...

最新文章

  1. CQRS及.NET中的参考资料
  2. 每日一皮:举一反三,这么聪明的客户可不多见了...
  3. Linux下不同服务器间数据传输
  4. 信管师培训之第十二节课作业(外包管理+需求管理+组织级与大项目管理)
  5. 支付业务流程--h5、APP
  6. mysql数据库 常用函数_《MySQL数据库》常用函数整理
  7. 微软Cloud+AI本地化社区贡献指南
  8. 01.MyBatis入门
  9. 关于豆瓣电台收费的思考
  10. 真正厉害的产品经理,都是“数据思维”的高手
  11. Java统计每个大写字母的个数
  12. 信息学奥赛一本通C++语言——1096:数字统计
  13. OpenStack-Icehouse(nova-network)多节点基础环境部署
  14. FPGA外设操作指南1: 8/16位PWM控制器
  15. Sublime Text3 Mac版去掉自动更新和添加中文
  16. 时钟树综合CTS技术经验分享(高薪必备)
  17. win7下mysql重置root口令
  18. 自动表单生成工具说明(后端、桌面、web、移动端)
  19. dopra linux 补全shell,~HS8145C补全SHELL教程,送给同是新手的猫友们~
  20. mapreduce-全局排序 -夜幕思年华

热门文章

  1. 闲的蛋疼:用算法解移动一根火柴问题
  2. 基于ssm+vue的医院门诊病历系统(源代码+数据库+11000字文档)626
  3. 马来西亚驻华大使馆公使衔参赞许达维一行到访清微智能
  4. kali监听不到附近WiFi
  5. 如何将AVI文件格式转换成MP4视频 1
  6. 首次参加字节飞书面试败北
  7. python 读写Excel的数据
  8. 家庭服务器数据中心将取代传统网盘
  9. 无法复制 pdb 文件到wince设备(CIPHER LAB 9570),调试失败
  10. 小霸王 精选集 84合1