IBM提出了大数据”5V”特点:

一、Volume:数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。

二、Variety:种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。

三、Value:数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。

四、Velocity:数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。

五、Veracity:数据的准确性和可信赖度,即数据的质量。

大数据5V特点 --- 5Vs of Big Data相关推荐

  1. 大数据5v指的是什么?——以沃尔玛为例

    Volume 大量的.大数据中数据的采集.存储和计算的量都非常大.那么大数据究竟要多大呢?正常的计算机处理4g数据需要4分钟的时间,处理1TB需要3个小时的时间,而达到1PB的数据需要4个月零3天的时 ...

  2. Talking Data副总裁高铎:我们如何赋予大数据生命力

    钛媒体注:一个大数据平台平台如何帮助企业发现大数据的魅力和价值?以下内容根据Talking Data副总裁 高铎在2016MIIC上的演讲整理: 当我们在谈论大数据的时候,我们究竟在谈论什么? 我们谈 ...

  3. 企业级技术与大数据BI——节选自专著《Big Data Fundamentals: Concepts, Drivers Techniques》

    作者: Paul Buhler,Arcitura公司. Thomas Erl,Arcitura公司. Wajid Khattak,Modus21公司. 内容: 企业级技术与大数据BI是专著<Bi ...

  4. 带你提前“剧透”首届Kylin Data Summit大数据盛会!

    大数据时代,数据已经成为企业发展和变革的核心驱动力,当企业面临不断增长的数据存储和日趋复杂的数据分析需求时,有效的进行数据管理对于企业成功完成数字化转型尤为重要. 在数字化转型的道路上,Informa ...

  5. 《深入理解大数据:大数据处理与编程实践》一一1.2 大数据处理技术简介

    本节书摘来自华章计算机<深入理解大数据:大数据处理与编程实践>一书中的第1章,第1.2节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区&quo ...

  6. 【大数据】Hadoop 体系(一)

    Hadoop 一.大数据导论 1. 数据是什么? 数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质.状态以及相互关系等进行记载的物理符号或这些物理符号的组合,它是可识别的.抽象的符号. ...

  7. 大数据架构+Lamba+Kappa+Unifield

    大数据架构+Lamba+Kappa+Unifield 前端+主数据服务(MDS)+后端 Tomcat  HBase ElasticSearch Pig Oozie Node.js JQuery 数据分 ...

  8. 近期活动盘点:2019清华大数据系统软件峰会(9.15)

    想知道近期有什么最新活动?大数点为你整理的近期活动信息在此 2019清华大数据系统软件峰会 Tsinghua University Big Data System Software Summit 20 ...

  9. 报名 | 2019清华大数据系统软件峰会

    2019清华大数据系统软件峰会 Tsinghua University Big Data System Software Summit 2019 信息技术与经济社会的交汇融合引发了数据迅猛增长,大数据 ...

最新文章

  1. SpringBoot第二十五篇:2小时学会springboot
  2. Linux     grep命令,正则表达式
  3. oracle 截取字符串中指定位置_手撕虚拟内存(1)——字符串在虚拟内存中的段位置与/proc虚拟文件系统...
  4. 发轫大数据 文思海辉荣获IBM“灯塔奖”
  5. 中粮集团对话农民丰收节交易会-万祥军:订单农业丰收经
  6. 数学公式、可视化图齐齐上阵,神经网络如何一步步走向最优化「看得见」!...
  7. iOS 的TextView的常规用法
  8. 积累的历年博客终于发完了
  9. python后缀名_python后缀名
  10. 如何有效去除博客上的广告
  11. CentOS 7 下配置ip forward(虚拟路由器)
  12. xlsm文件格式和xlsm文件打开方法介绍
  13. 一种内嵌P2P的wifi转红外发射神器
  14. Webpack4.0各个击破(6)loader篇
  15. 【社区图书馆】vue的生命周期
  16. C# 将打印机临时缓存文件SPL转为图片文件EMF
  17. [内核安全4]内核态Rootkit之IDT Hook
  18. 序列化器serializers的使用
  19. python怎么使用库里的pi_python怎么调用pi
  20. 二叉树前中后序遍历以及节点计算

热门文章

  1. 【Zotero文献管理】使用zotero+坚果云进行文献管理
  2. miRNA-Meta分析简介与实战
  3. 【坑】javascript中appName总是Netscape的原因
  4. 2020 年最受程序员欢迎的 20 个 CSS 框架,有没有你的菜?
  5. spring源码-Springboot解析配置类时,解析配置类的内部类
  6. 苏州新导智慧养老解决方案解决养老一切问题,智能化智慧养老方案
  7. ASEMI超快恢复二极管与肖特基二极管可以互换吗
  8. laravel框架 APP 支付宝支付
  9. 华为交换机S5700配置syslog收集交换机日志
  10. 塔式计算机sata3内部硬盘,巧用固态硬盘 解决PC用户3大疑难杂症