为什么需要数据建模?

数据建模就是数据组织和存储方法,它强调从业务,数据存取和使用角度合理存储数据。

良好的适合业务和基础数据存储环境的模型有以下优点。
1.性能:良好的数据模型可以帮助我们快速查询所需要的的数据,减少数据的 I/O吞吐。

2.成本:良好的数据模型能极大地减少不必要的数据冗余,也能实现计算结果复用,极大地降低大数据系统中的存储和计算成本。

3.效率:良好的数据模型能极大地改善用户使用数据的体验,提高使用数据的效率。

4.质量:料号的数据模型能改善数据统计口径的不一致性,减少数据就散错误的可能性。

总的来说,通过良好的建模方法,方便大数据系统更好的组织和存储数据,更好的平衡在性能,成本,效率和质量之间的关系。

阿里巴巴大数据实践数据建模篇读书笔记001-大数据建模的意义相关推荐

  1. 《大数据之路:阿里巴巴大数据实践》总述-读书笔记

    目录 0.前言 1.总述 0.前言 今天花了些时间较为详细的阅读了<大数据之路:阿里巴巴大数据实践>,主要内容如下及后续篇幅. 1.总述 从下至上依次分为数据采集层.数据计算层.数据服务层 ...

  2. 读《大数据之路-阿里巴巴大数据实践》数据模型篇笔记

    读<大数据之路-阿里巴巴大数据实践>数据模型篇 七 建模综述 OLTP 面向数据 随机读写 3NF OLAP 批量读写 不关注一致性更关心数据整合 ER模型–衍生出dataVault 维度 ...

  3. 5000字 大数据时代读书笔记_大数据时代读书笔记

    大数据时代读书笔记 [篇一:大数据时代读书笔记] 大数据时代 -- 读书笔记 一.引论 1. 大数据时代的三个转变: 1. 可以分析更多的数据,处理和某个现象相关的所有数据,而不是 随机采样 2. 不 ...

  4. 鸟哥的linux私房菜-基础学习篇 读书笔记

    从事linux工作一年多,算是能够熟练运用linux服务器,但仍觉得自己对Linux的原理,理论缺乏空洞,潜下心来认真阅读尘封的鸟哥经典,知识点很全,收获颇多,实践与知识结合,知行合一,对linux开 ...

  5. 鸟哥的LINUX私房菜 基础学习篇 读书笔记 -- 第零章 计算机概论 (一)

    鸟哥的LINUX私房菜 基础学习篇 读书笔记 -- 第零章 计算机概论 (一) 第零章 计算机概论 0.1 电脑:辅助人脑的好工具 0.1.1 计算机硬件五大组成部分 0.1.2 一切设计的起点: C ...

  6. 读书笔记:大数据清洗技术 03

    读书笔记:大数据清洗技术 作者:哈尔滨工业大学博导王宏志 第三章 实体识别 本节我们将着重讲一下实体识别算法中的串行实体识别. 1. 实体识别概述 同一对象的不同表示通常是由于信息来自不同的数据源.当 ...

  7. 读书笔记:大数据清洗技术 02

    读书笔记:大数据清洗技术 作者:哈尔滨工业大学博导王宏志 第二章 大数据处理技术概述 上一章我们主要从大数据的定义及特征,大数据的质量问题,大数据清洗技术的进展和本书的技术创新点四个方面对这本书有了初 ...

  8. Python编程:从入门到实践第六章读书笔记6.3遍历字典

    Python编程:从入门到实践第六章读书笔记6.3遍历字典 #coding:gbk#6.3.1遍历所有的键-值对 user_0 = {'username': 'efermi','first': 'en ...

  9. 小啊呜产品读书笔记001:《邱岳的产品手记-12》第22讲 产品经理的图文基本功(上):产品文档 23讲产品经理的图文基本功(下):产品图例

    小啊呜产品读书笔记001:<邱岳的产品手记-12>第22讲 产品经理的图文基本功(上):产品文档 & 23讲产品经理的图文基本功(下):产品图例 一.今日阅读计划 二.泛读& ...

最新文章

  1. 使用border-collapse:collapse;属性新建一个细线表格
  2. (五)Redis在项目中应用
  3. 书------编程(C#)
  4. angular4动态添加html,angular4 动态创建组件
  5. dism++封装系统使用教程_Dism++系统精简利器 10.1.4.7
  6. SWF 学习笔记 ——《如何在内存中提取出加密的SWF》
  7. Cesium开发基础获——取鼠标点击的经纬度(lon、lat)、高度(height)、相机的视角(heading、pitch、roll)
  8. Circular RNA的产生机制、功能及RNA-seq数据鉴定方法
  9. IE浏览器卡死的问题
  10. MySQL · Semi-join原理及源码分析
  11. 微信使用技巧 - 收集整理
  12. 实战VMware虚拟机下使用海蜘蛛软路由
  13. 微信小程序有哪些优点和价值
  14. IDEA一致卡在build时间过长问题处理
  15. 2011不同阶层理财大盘点
  16. HDU6411 带劲的and和(2018百度之星复赛,并查集,位运算,思路)
  17. landsat7数据预处理
  18. 第一次学习Web的总结
  19. Fighting Girl——那个IT女孩
  20. 9个最有趣的代码注释

热门文章

  1. 51单片机使用DS1302时钟芯片实现可调时钟
  2. JAVA日期时间的计算
  3. 无盘服务器 z10,Z10PE-D16/10G-2T
  4. Python从入门到实践习题答案(第九章 类)
  5. 达梦数据库分区表的使用
  6. display属性最详解
  7. 基于Android平台实现x的跑步应用App设计【附项目源码+论文说明】分享
  8. Excel设置保留被保护工作表的行列格式操作?
  9. 利用python-opencv读取视频,计算视频总帧数以及FPS
  10. 数据中台为什么那么火?