大数据是什么?华为云学院带你探索大数据之旅

我们首先从大数据是什么开始讲起!下面由我来带领大家!展开我们本次的大数据学习之旅!大数据是什么,内容将包括大数据的产生,发展大数据的基本概念。首先我们来追溯一下大数据的产生与发展,大数据的产生和发展主要经历了三个阶段。

第一个阶段,我们称为是萌芽期!自上世纪九十年代至本世纪初,随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识的管理技术也开始得到应用,比如数据仓库,专家系统知识管理系统等等。第二阶段我们称为是成熟期。本世纪的前十年 Web2.0应用的迅猛发展,非结构化数据的大量产生,使得传统的处理方法已经难以应对,而大数据技术却快速的突破。而大数据的解决方案也逐渐的走向成熟。大数据在成熟期形成了并行计算与分布式系统两大核心技术。谷歌的GFS和MapReduce等大数据技术呢也受到了追捧!开源技术Hadoop平台也开始大行其道!而第三个阶段我们称为大规模的应用期。2010年以后,呢大数据开始广泛用到各行各业!人们开始用数据来驱动决策,社会的信息化智能化程度也大幅的提高。所以,大数据的发展,历经茫崖成熟,再到大规模应用三个阶段.

我们了解了大数据的发展历程,那究竟什么是大数据?关于大数据的概念众说纷纭,甚至已经成为了一个商业问题,并且在商业出版社被大量的报道。比如福布斯的杂志报道称,大数据已经抵达赛特医疗保健家庭,通过使用这个分析工具,每年超过 200万的复杂病例患者得到了帮助。纽约时报指出,数据已经成为一类新的经济资产,就像货币或者是黄金一样。而CNBC呢也曾这样比喻,数据就像新型石油一样,为挖掘的没有什么价值,但经过加工提炼以后,将会极大的助力世界发展。那么我们究竟如何去定义大数据?其实呢到目前为止,大数据还没有一个明确的统一的定义,不同组织机构对大数据有着不同的描述。麦肯锡认为,大数据是指大小超出了典型数据库软件的采集存储管理和分析等能力的数据集。他认为大数据的一般范围是从几个TB到几个pb,而维基百科给出的定义是,无法在一定时间内使用常规的软件工具,对其内容进行抓取管理和处理的大量而复杂的数据集合。美国国家标准技术研究院给出的定义是,数量大,获取速度快,或者是形态多样的数据,难以使用传统的关系型数据分析方法进行有效的分析,或者需要大规模的水平扩展,才能高效处理的这种数据形态。而Gartner公司认为大数据是一种体量大快速和多样化的信息资产,需要使用高效率和创新型的信息技术加以处理,来提高发现洞察,做出决策和优化流程的能力。可见对大数据的定义还没有统一的定论。但不论哪一种描述,关于大数据的思维特征却是一致公认的。那什么才是大数据的思维特征?呢我们来一起认识一下。首先第一个V指的是VOLUME,容量。主要指非结构化数据的规模和增长速度。因为非结构化数据占数据总量的80%到90%,同时也比结构化数据增长快十倍到50倍,并且数据量是传统数据库的十倍到50倍。第二个V指的是为Variety,多元化。主要指大数据的易构和多样性。数据有很多不同的形式,比如文本图像视频机器数据等等,这些数据大多是无模式或者是模式不明显。第三个V值得是value,价值,主要体现在大量的不相关,信息价值密度低,需要通过深度复杂分析,才可以对未来的趋势和模式进行预测。第四个V指的是Velocity高效。 主要体现在实时分析,实时呈现分析结果 。好,那么接下来我们详细分析一下思维特征。第一个,V580亩数据的体量巨大,主要体现在从TB级别到pb级别。截至目前为止,人类生产的所有印刷材料的数据量是两百个pb。那么当前典型的个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近到一B级别,这是什么概念?呢我们来看一下容量单位的一些形象事例。比如一个pb等于1024个TB相当于50%的全美学术研究图书馆藏书的内容总和,一个1B等于1024个pb,那五个E币就相当于至今全世界人类所讲过的所有话语,一个ZB等于1024个1B如同全世界海滩上的沙子的数量总和。一个歪B等于1024ZB相当于7000为人类体内的细胞数的总和,可见呢大数据的数据量确实是海量的。第二个VVIP多样化,其实物联网数据互联网数据企业行业内的数据呢都是大数据的数据组成部分。那么大数据的多样性主要体现在,第一数据的来源多,企业内部多个应用系统的数据,互联网和物联网的兴起,带动微博社交网站传感器等多种数据来源。第二,数据的种类多,保存在关系型数据库中的结构化数据其实呢只占少数,而80%到90%的数据是诸如图片音频视频模型连接信息文档等等一些非结构化和半结构化数据。那么相对以往便于存储的以文本为主的结构化数据而言,这些非结构化数据越来越多。同时这些多类型的数据对数据的处理能力也提出了更高的要求。第三,关联性强。数据之间的频繁交互,比如游客在旅途中上传的图片和日志,其实与游客的位置和行程等信息呢有很强的关联性。因此大数据不仅体现在量的巨大,还体现在种类的丰富多样。而第三个VV6价值。对于大数据本身而言,它的价值密度低,这是它的典型特征。而如何去挖掘大数据的潜藏价值,像沙里淘金一样,从海量数据中挖掘稀有并且珍贵的信息,那么才是大数据的核心。那么第四个V指的是什么?呢第四个,V my last高校。在大数据领域能否实现实施的数据流处理,是区别大数据引用和传统数据仓库技术BA的关键差别之一。那比如我们以一秒为临界点,对于大数据应用而言,要求必须在一秒内形成答案,否则处理结果就是过时或者是无效的。根据I dc的数字宇宙报告,预计到2020年,全球数据的使用量将达到35.2个ZB那么在如此海量的数据面前,处理数据的效率就是企业的生命。好,以上就是大数据的思维特征。

下一次我们将继续探索大数据,如想进一步视频学习,请 请访问华为云学院( https://edu.huaweicloud.com/ )

我在华为云学院等你,不见不散喔 ~

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31556022/viewspace-2215540/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/31556022/viewspace-2215540/

大数据是什么?华为云学院带你探索大数据之旅相关推荐

  1. 华为云学院干货:服务创新大舞台在这里!

    华为云学院干货:服务创新大舞台在这里! Service Stage--一站式微服务云应用DevOps平台.新时代带来新机遇,同时企业IT系统也面临前所未有的挑战.伴随传统业务云化,海量用户进入,访问量 ...

  2. 什么是云连接?云学院带你了解华为云连接知识

    云连接为用户提供一种能够快速构建跨区域 VPC 之间以及云上多 VPC 与云下多数据中心之间的高速.优质.稳定的网络能力,帮助用户打造一张具有企业级规模和通信能力的全球云上网络. 通过购买一条云连接, ...

  3. 华为云快成长直播间大数据AI专场,加速经济物联网智能化提升

    万物智联的经济物联网环境,传统经济场景单一化.管理不集中.用户画像不精准等问题,促进了经济智能化提升,企业也需要更稳定.更安全的大数据平台作为经济提升的产品驱动力. 9月8日,华为云快成长直播间大数据 ...

  4. 听说你还在为海量数据构建不同数据仓库?华为云学院 DataLake了解一下!

    听说你还在为海量数据构建不同数据仓库?华为云学院 DataLake了解一下! By: FYS_CMSS 的CSDN 博客 "A data lake is a method of storin ...

  5. 华为云学院新春大礼包:场景化微认证上新了! 1

    自从华为云微认证上线以来,微认证便受到了广大开发者欢迎.华为云微认证是华为云场景化的技能认证,紧贴前沿科技,覆盖云计算.大数据.物联网.人工智能等热门领域,面向ICT技术爱好者.高校学生,提供场景化的 ...

  6. 消除数据孤岛,华为云DRS让一汽红旗ERP系统数据活起来

    本文分享自华为云社区<消除数据孤岛,华为云DRS让一汽红旗ERP系统数据活起来>,原文作者:心机胖. 数字化时代,数据成为新的生产资料,在经济文化生活中扮演着越来越重要的角色.买票你需要查 ...

  7. 11.11即将到来,华为云学院精品课程免费推荐奉上

    一年一度的剁手季,钱包已经空空了,大家都疯狂物质消费的时候,是不是该来点精神满足? 一年一度的光棍节,近看身旁无人陪,大家都约会而你苦于一人的时候,是不是该来点精神陪伴? 11.11剁完手不剁手约完会 ...

  8. 中秋节,华为云AI送上超级大月亮制作教程,体验赢开发者键鼠套装

    摘要:一键"Run in ModelArts",无需考虑计算资源.环境的搭建,简单运行代码,即可拥有你的超级大月亮,打造专属于你的梦幻中秋月夜. 本文分享自华为云社区<中秋节 ...

  9. 快速迁移数据中心:华为云数据库SQL Server实践案例技术解析

    1.   简介 企业或用户将数据中心部署在线下,采用独立软件提供商(Independent Software Vendor)软件进行管理.线下数据运维成本较高,故障容灾单一化,是目前遇到的瓶颈.采用云 ...

  10. 【华为ICT大赛】华为云激活设备的方法以及数据上下行

    先展示一下没有激活的时候在线调试的状态 然后下面我将激活他,让他变为下面这个样子 官方教程 这里我从0演示一个产品的创建到MQTT.fx连接到云平台并且接收数据. 进入华为云平台控制台 然后开始创建一 ...

最新文章

  1. AC日记——[HNOI2010]BOUNCE 弹飞绵羊 洛谷 P3203
  2. 那个脑袋生锈的我写的东西
  3. map has no len python3
  4. Android:按键响应方式第一种onClick属性,第二种方法接口类,第三种方式匿名内部类,第四种方式Activity
  5. 1014 Waiting in Line (30 分) 【未完成】【难度: 难 / 知识点: 大模拟】
  6. iOS常见问题(5)
  7. IIs管理服务一直启动失败的原因之一
  8. 男女共厕,考验男生心理素质的时候到了......
  9. Http中的同步请求和异步请求
  10. jupyter notebook介绍、安装以及使用教程
  11. C#操作Word(转)0
  12. 四级过了,我却高兴不起来!
  13. 程序员面试金典——4.7最近公共祖先
  14. 最顶尖的12个IT技能
  15. js实现将网页下载为pdf
  16. 自媒体原创度检测工具有哪些?这几个可以免费用
  17. 背景知识:从熵(Entropy)到互信息(MI,Mutual Information)
  18. 数据安全合规体系建设白皮书
  19. html表格不能横向自动展示,layui数据表格table横向滚动条不显示纵向滚动条显示不完整...
  20. 微帧Film Grain编码技术,致敬电影胶片颗粒的独特魅力

热门文章

  1. 计算机网络安全基础的上机知识,网络安全上机竞赛试题操作演示.pdf
  2. 小刘同学的第一百五十八篇日记
  3. 走进脑计划(四):linux下安装SPM、DPABI
  4. ADS1115 应用指导
  5. STM32, ADS1115
  6. Edge浏览器打不开网页解决方法教学
  7. CUDA编程1--GPU内存模型
  8. Pandas: Drop函数(Dataframe删除指定行列)
  9. 南阳oj 题目72 Financial Management
  10. 华硕笔记本BIOS详细设置