在数据分析师培训或数据挖掘师培训非常火爆的今天,更多人凭借着自己的努力或兴趣爱好逐步踏入了大数据的行列,想在这大数据分析与大数据挖掘的大圆盘中占领自己的一席之地。不过,我们在参加大数据分析或大数据挖掘培训前,在决定是否真的进入到大数据行列前,我们必须要首先搞懂或者先弄明白大数据究竟是如何发挥自己的价值的。这一点很重要,因为现在我们学习数据分析或数据挖掘的专业技能和知识,都是为了学以致用,都是为了在职场中发挥价值,如果我们不懂得大数据究竟是如何发挥自己的价值的,我们就匆匆忙学习数据分析或数据挖掘,那么我们会难以找到适合自己走下去的方向和道路。下面小编就来告诉大家,大数据究竟是如何发挥自己的价值的。这可是一名数据分析师必备的哟!

3月的浦东新区,天气依旧略有凉意。张江高科技园区一个四周是玻璃的高档办公楼里,一大早,市场部门的资深员工李小姐正在自己的座位上开始一天工作之前的热身:倒杯水,花上一刻钟到半小时在各大网站上浏览当天要闻。在她最经常去的几个论坛里,通常汽车、服装,或者旅游促销的广告会不请自来;最近她发现这种多年不变的情形有了些不经意的变化,比如刚刚跳出的这个窗口:大数据分析帮助你锁定高价值客户“大数据”和旅游论坛有啥关系?她百思不得其解。

她所不知道的是,她在浏览器搜索界面里曾经输入的“客户”、 “促销”、“通信录”等关键词,已被IE上面挂靠的抓取程序自动获取,并且被关联了相应的广告,由IE插件完成最终的广告推送。在北京郊区某处的机房里,基于“关联规则”和“聚类”等统计分析方法的分析软件在时刻不停地处理成千上万个李小姐产生的数据。

她或许还没有注意到的是,大数据和分析正在成为全世界炙手可热的概念。先是几年前谷歌首席经济学家宣称:数据分析员正成为21世纪最性感的职业;又有2012年3月29日奥巴马政府公布“大数据研发计划” (Big Data Research and Development Initiative),白宫科技政策委员会(OSTP)还成立了大数据高层指导小组以推动这一战略规划。再有就是今年的事情了,地球人都已经知道,2013年是“国际统计年”。

几个月前,JMP的老朋友Michael Rappa教授于美国众院聆讯,主题正是“Next Generation Computing and Big Data Analytics”――下一代计算及大数据分析。Rappa教授作为IAA(Institute of Advanced Analytics, NCSU,北卡州立大学高等分析学院)创始人,去年被美国科学基金会新创立的大数据委员会任命为学术联合主席。奥巴马政府的大数据研发计划资金正是来自于美国科学基金会。

国内学术界,得益于前中国人民大学常务副校长袁卫先生及其他统计学界知名教授学者的持续不懈的努力,2012年,教育部终于把统计从数学的范畴内独立出来,正式升级成为与数学、物理、化学、计算机等大学科平级的“一级学科”。

以统计学为核心的数据分析方法正在学术、工商和政府等领域显现出越来越大的价值。李小姐电脑上的变化,则是这一趋势的小小表征。

最近Gartner发布了2017年度商业智能和分析的魔力四象限图,报告明确指出,大数据和分析正在成为企业IT规划的核心。

一切的现象都在告诉人们,一个新的科技时代似乎正在来临。有些IT职业追潮人士甚至激动地认为“人类历史上第三次科技革命”即将到来。

大数据之惑

问题在于,什么是大数据?为什么人人言必称大数据?

“很大很大的数据”就是大数据。对“大”的定义在不断刷新。10年前1GB数据已经很大了,今天,1000GB并不算太大。

问题其实不在于大,而在价值。“大数据”再大仍旧只是数据,没有足够有效的分析与应用,一切数据都是垃圾。纽约时报专栏作家David Brooks认为,缺乏足够有效的分析是大数据的最大问题:越来越多的数据,带来越来越多的相关性;其实很多相关性都是没有意义的,这种欺骗性质的数据关联会把数据管理者和使用者引入歧途,浪费大量的人力物力去管理、分析这些数据。

除了传统意义上人们认为的那些有行有列有数值或者文字的数据表单之外,IT技术还帮助人们收集了越来越多的其他类型的资料,比如视频,语音,图片,文档等。这些被称为“非结构化数据”。

结构化与非结构化数据每天都在成倍的增加。以道路视频监控为例,全上海的摄像头有10多万个,每一刻都在记录图片与视频。一旦发生案件或者事件,这些记录在硬盘库里的资料就成为侦察与审判环节的重要证据。尽管目前技术尚不支持,业界仍然期望未来能在TB乃至于PB级的视频数据里搜到一张特定身影或者脸孔。这类搜索/分析技术未来将是启动视频类大数据应用的引擎。

同样,基于语音、照片或者文本的分析与数据挖掘同样可以给人类对数据的理解带来革命性的突破。问题在于,这类技术仍停留在实验室阶段。

尽管没有足够的应用,大数据仍然不可阻挡地火热了起来。不扯上大数据似乎就要落伍了一样,大数据满天飞的日子来到了。至于这股潮流到底会演变成象.com一样的泡沫,还是第三次产业革命,在华威先生们眼里,已经根本不重要了。业界,数据库/存储等领域供应商当然乐见其成,而企业的IT经理们则又多了一个申请预算的借口。

数据的价值及企业数据战略

数据的获取与存储仍然是IT建设的基础架构。一旦决定启动“大数据战略”,对资源源源不断的占用使得这一工作黑洞化。如何规避这种大数据黑洞?结合全球主要行业领导企业以及部分小而强的欧洲企业的成功案例,我认为,应该以应用(分析及业务决策)为中心建立相应的数据战略,并且随之建立相应的从收集数据、管理数据到最终业务决策的一整套流程。而不是为数据而数据——首先要建立以应用为中心的数据战略。说到应用,银行、保险、汽车、化工等几乎所有行业都在开展以数据分析为基础的各种应用,以JMP软件全球行业案例库里面的部分典型客户为例:

电商在分析顾客采购行为数据,以进行促销和相关货品推荐(交叉/提升销售)

航空公司在调查旅客反馈,以改进空中服务(客户挽留)

药厂在对临床实验数据进行分析,以判断新药的安全性和有效性(研发新产品)

汽车厂商在对维修信息进行分析,以改进汽车整车和关键零部件的可靠性以提升客户满意度(挽留及获取客户)、降低客户拥有成本和车厂的保修成本(降低成本)

手机公司在对手机销售量进行预测,以合理排产与优化库存(运营优化)

卫生管理部门在运用数据模型对流行病趋势进行描述、监控与预测

银行在对客户服务流程进行优化与改善,以提升客户满意度

电脑厂商在利用客户对不同配置组合进行市场调查,以进行定价

保险公司在根据保单出险情况进行保单定价的动态调整,以确保该产品基本盈利能力

半导体企业在对制造全流程数据进行分析/建模/优化,以改善工艺,提升良率,从而实现成本降低与利润提升

食品公司在利用数据分析和市场调查手段,研发本地客户最喜好的口味

快速食品行业在利用JMP地图分析工具与人口统计学相结合,以进行门店选址,客户获取及供应链优化

只有足够有效的应用,方可获取数据的价值。企业只有在战略层面确立了数据分析的重要性,方可持续改善。以GE为例,六西格玛及相应的数据分析流程已经成为GE的全球战略与文化。不仅如何,GE还持续不懈地推动基于数据分析的持续改善工作。在高端航空发动机研发及GE能源系统业务领域方面,GE也与时俱进,导入JMP所代表的业界最高水平的实验设计(DOE)方法,以进一步提升其研发水平。

其次,一切都离不开人。与这股指数级增长的数据分析需求相对应,统计、分析类人才正成为职场上的稀缺品种和抢手货。3月初华尔街日报刊登了“全美最抢手职业排名”,数据分析类职位高居榜单第二位。这是美国。对中国来说,或许排名更高,因为稀缺。

最后,建立一整套以数据分析及决策流程,以取代传统的拍脑袋决策体系。这一点对于中国企业来说尤其需要强调。这不仅仅是对战略的有效执行,更需要企业拿出“改变”的决心和勇气,在制度层面体现出对“改变”的鼓励和包容。

在这个应用为王的年代,对于企业来说,不论是搭建基础架构还是应用软件,要不要投入,如何投入,其实是个老话题了,无外乎价值与价格。大数据/云计算,不论名字如何变化,逻辑依旧。

大数据是如何发挥自己的价值的?相关推荐

  1. 大数据在犯罪预防中有独特价值

    互联网技术突飞猛进的发展不断突破人类现有认识范围,悄无声息地改变着二进制世界的固有局限,预示着大数据时代的到来.从目前看,大数据不仅改变着人们的生活方式,还为人们提供了认识世界的最新工具,人们可以通过 ...

  2. 工业大数据浅析(上篇)——工业大数据的概念、发展及价值

    目录 1.引言 2.工业大数据概念 3.工业大数据起源 4.各国工业大数据实践 4.1.德国的"工业4.0" 4.2.美国的"CPS和工业互联网" 4.3.日本 ...

  3. 专家纵论谈大数据:认清本质 挖掘真价值

    在日前举行的"第十届国家信息化专家论坛"上,众多专家阐述了对"开放数据与大数据发展"的看法. 工业和信息化部副部长杨学山表示,大数据概念的出现让人类社会看到了信 ...

  4. 大数据的七个核心应用价值

    随着移动互联网的飞速发展,信息的传输日益方便快捷,端到端的需求也日益突出,纵观整个移动互联网领域,数据已被认为是继云计算.物联网之后的又一大颠覆性的技术性革命,毋庸置疑,大数据市场是待挖掘的金矿,其价 ...

  5. 大数据平台分析发挥哪些作用

    所谓大数据带给人们的期望太有诱惑力了,从肿瘤分析到基因测序,从区域健康大数据平台到患者慢病管理,人们争先恐后地收集越来越多的数据,希望能发现获得成功的黄金信息. 然而这个过程很漫长,一个问题就会带来一 ...

  6. 大数据:知识,真正的价值体现

    转载自:http://www.itongji.cn/article/062422N2013.html 6月21日消息,大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻.全面的洞察能力 ...

  7. “大数据”挖出老鼠仓的政治价值

    随着基金"老鼠仓"不断被揪出,"大数据"监管这个字眼也逐渐被投资者所熟悉.靠"大数据"这个利器,监管机构对内幕交易的稽查力度越来越大,今年以 ...

  8. 【干货】郭朝晖:工业大数据的特征、方法与价值创造

    嘉宾介绍: 郭朝晖,现为宝钢中央研究院首席研究员.教授级高工.分别于1990.1994.1997年在浙江大学应用数学.化学工程和自动化专业获得学士.硕士和博士学位.1997年加盟宝钢,2005年晋升教 ...

  9. 大数据时代-使用关系型数据库的价值意义?

    不知道大家有没有这种经历:一个系统刚上线的时候是有完整的架构逻辑的,数据库表的设计也是经过精细推敲,以为可以经得起时间的考验.结果呢?上线之后各种新业务支持.新需求支持.不得不在原有的数据表中添加字段 ...

最新文章

  1. 2017-2018-1 20155204 《信息安全系统设计基础》第十一周学习总结
  2. layer output 激活函数_一文彻底搞懂BP算法:原理推导+数据演示+项目实战(下篇)...
  3. android 拖动的view,Android实现随意拖动View效果
  4. 来自韩国的优秀Java应用性能监控软件JENNIFER
  5. 《数字图像处理》冈萨雷斯学习笔记3:频域处理
  6. Bootstrap的全局css样式部分
  7. 数据模型与决策_数据模型与决策复习资料拿走不用客气
  8. 全国计算机等级考试题库二级C操作题100套(第91套)
  9. JBoss AS 7类加载说明
  10. CSS3实现烟花特效 --web前端
  11. java实现递归算法_如何在Java中实现二进制搜索算法而无需递归
  12. Linux下的Shell编程之Helloworld.sh看过来
  13. 教你在macOS Big Sur 11.0 系统中在右键菜单中添加发送共享到微信或QQ的功能?
  14. java项目介绍_java项目介绍及创建
  15. 传奇服务端GOM引擎和GEE引擎区别在哪里?
  16. Java应用无响应、内存飙升、CPU飙升排查
  17. 计算机基础的课程标准,《计算机基础》课程标准
  18. 异步电机三相电流滞环矢量控制
  19. 哨兵二号波段介绍_警告!欧空局发布的哨兵二号卫星L2A产品存在严重问题
  20. 计算机科学家事迹,【CCF会员故事-14】计算机软件科学家谢涛:星辰大海,求思进取...

热门文章

  1. div html 下边加横线_HTML如何在两个div中画一条横线 | 学步园
  2. 2015创业邦年会大佬精彩观点集锦
  3. 如何通过Win10系统的密码重置盘来重置电脑开机锁屏密码?
  4. 数据库关系运算之除法(详细)
  5. android的pptp设置方法,Android系统如何配置PPTP 客户端拨号
  6. python做社会网络分析系统_科学网—python 社会网络分析工具之igraph - 郗强的博文...
  7. python中几种读取文件的方法_科学网—python中几类文件的读写 - 郗强的博文
  8. Dubbo-kubernetes 基于 Informer 服务发现优化之路
  9. 商城类项目业务简述 可用于面试沟通项目话术 软件测试web项目app项目通用
  10. 分布式事务原理及解决方案