最近读了《大数据时代》这本书,觉得写得非常好,读了一遍意犹未尽,于是回过头来再看一遍,把一些精华摘抄出来。

引言—— 一场生活、工作与思维的大变革

谷歌的冬季流感预测系统:关注特定检索词条的使用频率与流感在时间和空间上的传播之间的联系。谷歌以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。

大数据导致新的处理技术的诞生:mapReduce、Hadoop

互联网公司可以收集大量的有价值的数据,而且有利用这些数据的强烈利益驱动力,所以互联网公司顺理成章的成为了最新处理技术的领头实践者。

大数据时代人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础上是无法完成的。大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构、以及政府与公民关系的方法

产生大数据的领域:天文学(海量的天文观测数据)、生物医学(破解基因碱基对)、金融(股市交易)、互联网

1KB (Kilobyte 千字节)=1024B,
  1MB (Megabyte 兆字节 简称“兆”)=1024KB,
  1GB (Gigabyte 吉字节 又称“千兆”)=1024MB,
  1TB (Trillionbyte 万亿字节 太字节)=1024GB,
  1PB (Petabyte 千万亿字节 拍字节)=1024TB,
  1EB (Exabyte 百亿亿字节 艾字节)=1024PB,
  1ZB (Zettabyte 十万亿亿字节 泽字节)= 1024 EB,
  1YB (Yottabyte 一亿亿亿字节 尧字节)= 1024 ZB,
  1BB (Brontobyte 一千亿亿亿字节)= 1024 YB.

大数据——量变导致质变。增加所利用的数据量时,我们就可以做很多在校数据量的基础上无法完成的事情。

预测是大数据的核心——它是把数学算法运用到海量的数据上来预测事情发生的可能性。如:一封邮件被作为垃圾邮件过滤的可能性,输入teh应该是the的可能性。

个性化技术是大数据时代的最重要的技术,参考《Physics Reports》上发表的名为“Recommender Systems”,吕琳媛

大数据,大挑战——第一、在大数据时代,可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。与局限在小数据范围相比,使用一切数据为我们带来了更高的精确性,也让我们看到了一些以前无法发现的细节。第二、研究数据如此之多,以至于我们不再热衷于追求精确度。当我们拥有海量数据时,绝对的精准不再是我们追求的主要目标。我们不再需要对一个现象刨根究底,主要掌握大体的发展方向即可。当然,我们也不是完全放弃精确度,只是不再沉迷于此。第三、不再热衷于寻找因果关系,应该寻找事物之间的相关关系。大数据告诉我们“是什么”,而不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。

《大数据时代》摘抄,引言部分相关推荐

  1. 《大数据时代》----重要理念摘抄

    作者:维克托·迈尔-舍恩伯格 最近看了一本有历史的书<大数据时代>(拿研究成果来说三年前的已经是老成果了),作者对 我们这个大数据时代产生了很多颇有意思的洞见,为了保持原汁原味,我就直接原 ...

  2. 《大数据时代》---- 读书笔记

    作者:维克托·迈尔-舍恩伯格 最近看了一本有历史的书<大数据时代>(拿研究成果来说三年前的已经是老成果了),作者对 我们这个大数据时代产生了很多颇有意思的洞见,为了保持原汁原味,我就直接原 ...

  3. 【2016年第4期】大数据时代的简约计算

    张家琳,孙晓明 中国科学院计算技术研究所,北京 100190 摘要:大数据存储和分析的能力是未来创新型国家的核心战略能力.当前关于大数据的理论研究在共性问题提炼.方法论框架和实时数据算法理论上仍存在一 ...

  4. 【2016年第3期】大数据时代的数据科学家培养

    朱扬勇1,2,熊贇1,2 1.复旦大学计算机科学技术学院,上海  200433:2.上海市数据科学重点实验室,上海  200433 摘要:大数据时代,最热门的职业是数据科学家(data scienti ...

  5. 《大数据》2015年第3期“网络大数据专题”——大数据时代的互联网分析引擎...

    大数据时代的互联网分析引擎 窦志成,文继荣 (中国人民大学信息学院大数据管理与分析方法研究北京市重点实验室 北京 100872) 摘要:随着互联网尤其是移动互联网的高速发展,互联网文档的数量.内容的丰 ...

  6. 《大数据》2015年第2期“研究”——大数据时代的数据传输网

    大数据时代的数据传输网 孙卫强,胡卫生 上海交通大学区域光纤通信网与先进光通信系统国家重点实验室 上海 200240 摘要:大数据时代数据传输需求呈爆炸式增长,如何充分利用数据流的新特征,发挥不同交换 ...

  7. [读书总结]大数据时代

    目录 引言 一场生活.工作与思维的大变革 第一部分 大数据时代的思维变革 01.更多 02.更杂 03.更好 第二部分 大数据时代的商业变革 04.数据化 05.价值 06.角色定位 第三部分 大数据 ...

  8. 《大数据时代》(维克托·迈尔·舍恩伯格)读书笔记

    观点摘录 序言引言 推荐序一 推荐序二 译者序 引言 第一部分 大数据时代的思维变革 01 不是随机样本,而是全体数据 02 不是准确性,而是混杂性 03 不是因果关系,而是相关关系 第二部分 大数据 ...

  9. 大数据时代下对马克思主义的一些探讨

    1 引言 最近因为查阅文献的原因,让我接触到了大数据,以前也听到过"大数据"这个词语,但却从未引起我的重视.平时需要查阅大量文献,相比于数十年前,现在的搜索引擎为学习提供了莫大的方 ...

最新文章

  1. RuntimeError Assertion cur_target = 0 cur_target n_classes failed
  2. 深度学习模型保存_解读计算机视觉的深度学习模型
  3. 黑马day14 过滤器概述amp;生命周期amp;运行过程
  4. 初接触php,遇到一个低级问题
  5. 服务器所有文件,检索服务器端文件夹中的所有文件
  6. 【转】TcpListener和tcpclient使用
  7. html 提交后跳转页面,html 提交后跳转页面
  8. Ubuntu中Unable to acquire the dpkg frontend lock (/var/lib/dpkg/lock-frontend)问题的解决
  9. python列表用法大全
  10. Asp.net上传文件至目录
  11. 汇编语言 王爽 第四版 实验3
  12. nginx: [error] OpenEvent(“Global\ngx_reload_7652“) failed (2: The system cannot find the file specif
  13. 联盟显示服务器异常,玩英雄联盟ping值异常,我们如何检测网络问题,还是服务器?...
  14. 【实用教程】让我来帮你一键下载公zhong号图文封面吧(文末附小白教程)
  15. Intel汇编-无符号整数的乘法操作
  16. 2020年11月 工信部考试——Hadoop(数据应用技术)中级认证 1
  17. ubuntu20.04开机黑屏解决方法
  18. 微信公众平台如何给粉丝分组打标签?
  19. 投资理财-言微不劝人
  20. 股票风险 股票交易上的投机行为往往十分危险。假设某股票行为十分怪异,每天不是涨停(上涨10%)就是跌停(下跌10%)。

热门文章

  1. Ubuntu拼音输入法安装的问题
  2. Zero date value prohibited 异常处理
  3. VUE Module build failed: TypeError: this.getOptions is not a function at Object.loader 解决办法
  4. Vmware VCB/VDR
  5. 华为发布“5G最佳网络”解决方案,已获91个5G商用合同
  6. JVM(3)之垃圾回收(GC垃圾收集器+垃圾回收算法+安全点+记忆集与卡表+并发可达性分析......)
  7. 过去式加ed的发音_英语单词过去式+ed,读音变化有什么规律
  8. 贯彻学习大会文件精神主题知识竞赛
  9. STA-11. 芯片中的偏差和风控机制
  10. SpringSecurity-笔记