“大数据”(Big Data)已经成为当前社会的热门词汇,不但在计算机领域,即使在全社会领域也成为人们耳熟能详的名次。甭管了解不了解,只要聊起新技术,“大数据”必然是挂在嘴边的词汇。要不,你看看全国各地、各城市的发展报告,几乎每个城市、每个地区都要发展大数据产业,牛一点的城市,像北京、深圳,那几乎是要把这个当成支柱产业的架势。就连贵阳,这种以前无论如何无法和信息化、互联网领先城市联系起来的地方,都轰轰烈烈的搞起了大数据产业,而且走在全国前列,实实在在颠覆了我对全国信息化地区格局的认知底线。

那么,到底什么是大数据?我觉得,还是得从大数据是怎么来的一点一点捋一捋。

不过,这不捋不知道,一捋吓一跳。网上关于大数据的由来五花八门,靠谱不靠谱的让人眼花缭乱,我选取了几个毕竟流行的大数据来源的段子和大家分享一下。(有人肯能会说,这不是吃饱了撑的吗,管它从哪儿来,知道它是怎么回事不就行了吗?您说的太对了,持以上观点的童鞋可直接略过本部分,这部分就是没事找着玩的,哈!)

段子一:

尽管“大数据”这个词直到最近才受到人们的高度关注,但早在1980年,著名未来学家托夫勒在其所著的《第三次浪潮》中就提出,“如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据’才是第三次浪潮的华彩乐章。”《自然》杂志在2008年9月推出了名为“大数据”的封面专栏。从2009年开始“大数据”才成为互联网技术行业中的热门词汇。

这个段子说,大数据一次最早是1980年提出的,说的是有根有据。兄弟我还真找来这本书,1983年三联书店朱志焱先生翻译的,花了N长时间翻阅了一遍,反正我没找到,哪位朋友如果找到了这个话,麻烦告诉我,我找到好辛苦的……

不过,虽然探寻“大数据”源头之旅失败了,但是,我没想到,这本30多年前的书着实让我惊叹了一把,书中关于数据和信息,有一段文字堪称经典,摘录如下:

第十四章  智能环境  P194、P195

当社会记忆储存在人类头脑中时,它不断被侵蚀,更新和变动,不断地以一种新的方式组合,再组合。它是积极的,能动的。它确确实实是充满着活力,是有生气的。

当工业文明把很多社会记忆从人类头脑中取出来时,记忆变成了客观对象,体现在人工印刷品,书籍,工资单,报纸,照片和电影中。但是一旦符号被写在纸上,复制在照片上,摄入电影中,印刷在报纸上,就变成消极静止的东西了。只有当这些符号再一次被人脑所吸收时,这些东西才变活了,并且以一种新的方法操纵和重新组合。第二次浪潮文明在急剧的扩大社会记忆的同时,实际上也将社会记忆冻结了起来。

第三次浪潮信息领域所以称为历史性的大事,不仅是它极度地扩大了社会记忆,而且还把它起死回生。因为计算机能处理它储存的数据,这样就出现了一个史无前例的现象:社会记忆变得既丰富又活泼。这两者的结合,证明是有推进力的。

这种情势将释放出新的文化能量。因为计算机不仅能帮助我们将“瞬息即变文化”组成或合成为现实的有条理的模式,它也开拓了可能的极限。图书馆,档案馆都不能思考,更不用说用非传统的方式来思考了。但是相比之下,我们可以要求计算机“思考难以想象的和以前没有想到的事情”。这样就有可能出现大量新的理论,新的思想,新的观念,新的艺术见解,新的技术进展,新的经济和政治的创见。老实说,在此以前,这些事情都是难以置信和不能想象的。这样,它促进了历史变革,向第三次浪潮多样化的社会挺近。

以上这段对于数据的认识牛不牛?太牛了,再看看2016年王坚博士的《在线》一书的观点:

★今天数据的意义并不在于有多“大”,真正有意思的是数据都变得在线了,这恰恰是互联网的特点。......写在磁带和纸上的数据,作用是有限的;

★离线的数据难以产生最大化的经济价值,在线的可以;离线的数据难以产生最大的社会竞争力,在线的可以;离线的数据难以产生大的影响力,在线的可以;

★数据本身没有价值,...直到你有计算能力去处理才会产生价值。计算,如同其他基础设施一样,能够把沉寂的数据“沙子”变成经济、产业、财富的“金矿”。

一比较,有没有一种跨越了30年的两位大牛共论数据之道的感觉,1980年啊,托老先生就对数据有如此深刻的见解,让我瞬间对他的崇拜之情犹如滔滔江水,连绵不绝……

好像有点跑偏了,好吧,我们再拐回来。

段子二:

大数据是SGI的首席科学家 John R. Masey 1998年首次提出的。

SGI是个什么东东呢?SGI(Silicon Graphics )是美国硅图公司,成立于1982年,是一个生产高性能计算机系统的跨国公司。这公司虽然不太出名,但是也是很牛X的一家公司,许多电影,包括《侏罗纪公园》、《魔戒》、《泰坦尼克号》等等,均是在SGI的图形工作站上制作出来的。

这个PPT我也找到了,标题是《Big Data ...and the NextWave of InfraStress》,其中的InfraStress是Infrastructure Stress的缩写,他主要描述的是由于数据量的增大给计算机的各种基础设施,包括CPU啊、内存啊等等带来的压力,感觉和我理解的大数据沾那么一点点边吧,不过也就一点点。

段子三:

最早提出“大数据”概念的是全球知名咨询公司麦肯锡,在其2011年的研究报告《大数据:下一个创新、竞争和生产率前沿》中首次提出“大数据”一词,认为:数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。

这个段子就有点扯了,因为08、09年的时候,大数据就开始有很多文章谈论了,麦肯锡应该是比较早进行研究和应用大数据的公司,但要说是他提出来的,恐怕他自己都不信。

啰啰嗦嗦说了这么多,那么,到底大数据的概念是谁先提出来的呢?看来,这个版权暂时找不到拥有者,这哥们损失得多大啊,提出了一个上万亿产业的概念,不赶紧出来认领,看来确实不是我,我没有那么优秀的品质,哈!

不过我认为,计算机及互联网的发展史上,这种无头公案非常多,因为最早使用这个词汇的,未必是今天我们理解的含义,它会在信息化飞速发展的浪潮中不断地完善、发展、丰富着自己的内涵和外延,”大数据“只是一个名词,我们更多的是如何理解它,应用它(看到这儿的朋友是不是有一种要冲过来打我的冲动,冷静,冷静,冲动是魔鬼啊J)。

那么,到底怎么理解大数据呢,请听下回分解。

工业大数据漫谈1:大数据的由来相关推荐

  1. 工业大数据漫谈4:工业大数据的作用

    工业大数据的概念提出后,IT业界结合新的大数据技术和自身对工业的理解,提出了大量的解决方案,有许多已经在现实中的到了应用.应该说,工业大数据目前的应用情况是不太好的,除了少部分用户确实得到了好处外,大 ...

  2. 工业大数据漫谈3:什么是工业大数据?

    前面两部分我们大概了解了一下大数据的由来和特点,这一部分我们来看看什么是工业大数据,它和传统我们理解的大数据有什么不同? 在了解什么是工业大数据的时候,我觉得我们有必要先了解一下什么是工业以及工业都包 ...

  3. 漫谈阿里那些大数据技术,大数据学习者必看

    目前人人都在谈大数据,谈DT时代,但是,大数据是什么,每个人都有自己的一个看法,好比盲人摸象,每个都认为自己摸到是真正的大象.我也担心我所看到的,只是大数据的冰山一角,毕竟,将引领整个人类下一次变革的 ...

  4. 物联网、消费物联网、工业物联网与云计算、大数据服务综合分析报告

    物联网.消费物联网.工业物联网与云计算.大数据服务综合分析报告 一.物联网基本概念 1.1定义 物联网(Internet of Things)指的是将无处不在(Ubiquitous)的末端设备(Dev ...

  5. 【工业大数据】工厂大数据之数据源分析;如何挖掘并驾驭大数据的价值,成为“大数据企业”?

    众所周知,工业大数据是工厂智能化水平提升的关键路径,而数据源的分析和管理是工厂大数据的基础,理清理顺数据源也是实施工厂大数据的第一步.本文就对工厂的数据源进行简要分析. 数据源的划分 以下从两个维度对 ...

  6. 《大数据漫谈 -- DT时代》连载之 NO.1

    免费开通大数据服务:https://www.aliyun.com/product/odps 本文作者拖雷(陈吉平),袋鼠云CEO ,国内最早一批Oracle ACE Director,前阿里巴巴研究员 ...

  7. 从数据来源、数据生态、数据技术、数加平台等方面,漫谈阿里大数据

    目前人人都在谈大数据,谈DT时代,但是,大数据是什么,每个人都有自己的一个看法,好比盲人摸象,每个都认为自己摸到是真正的大象.我也担心我所看到的,只是大数据的冰山一角,毕竟,将引领整个人类下一次变革的 ...

  8. 典型工业企业大数据平台解决方案(含数据治理)

    一.总体思路 当前,工业企业产生的数据日与俱增,如何利用大数据为企业产生驱动力.竞争力成为工业企业面临的重要问题.工业企业大数据平台建设的总体思路是将现有PLC.MES.ERP.CRM.SRM.SCM ...

  9. 大数据漫谈2:大数据价值点在哪里

    专家简介:李剑杰,新炬网络架构师,资深数据资产管理.大数据专家,10年数据资产管理经验,曾参与多个移动.联通.银行.烟草数据资产管理项目,对数据资产有丰富的项目规划管理.落地实施经验. 大数据究竟有多 ...

最新文章

  1. SFB公开课:TMG/IISARR/Web Application Proxy/发布UC(Lync/SFB)-2-通知
  2. 如何将spring源码作为导入eclipse中,变成一个普通的项目(git、github)
  3. Java正则表达式基础案例和语法
  4. 什么是nginx负载均衡高可用
  5. java之List常用方法(一),Java 常用方法
  6. exit()函数学习
  7. 如何评价一个开源项目——协作影响力
  8. ssd训练自己数据集
  9. Java:Swing篇,实现JList、JTextArea的自动滚动,实时刷新功能
  10. 关于Quartz 2D绘图的简单使用
  11. 搞定问题描述的5W2H法是什么
  12. AR公共安全及应急指挥中的应用 | TVP思享
  13. 局域网监控软件:让员工上网行为规范形成自觉
  14. python 批量爬取网页pdf_批量抓取网页pdf文件
  15. win7/win10 密码忘了?没关系,利用5次shift,9步轻松破解密码
  16. VS2013安装SVN插件
  17. 基于spring boot的人民医院体检预约系统
  18. android+音乐节拍检测,科学网—音乐节拍跟踪或音乐节拍检测软件,LilyBeats alpha - 石自强的博文...
  19. python——基础3
  20. 智慧社区运维可视化管理平台主要有哪些功能?

热门文章

  1. 了解计算机技术的课件,漫游计算机技术的世界【PPT课件】_文库吧
  2. GG修改器功能一览及对游平衡性的影响
  3. 小程序直播 OBS 画质_小程序直播插件怎么开发?
  4. 利用CurrentCulture将人民币符号更改为欧元符号
  5. 推广思考:选对平台,推广事半功倍!
  6. Nuxt引用@nuxtjs/proxy代理接口,处理多个域名
  7. 制作Java告白exe应用程序(跑马灯+MusicPlayer)超简单
  8. 网络上排名前500的电子电气网站
  9. 生存分析(survival analysis)
  10. 2023年AP考试报名已开启,AP理科各科目难度系数和五分率盘点