大数据有很多算法和模型可以解决这些处理过程中的技术问题,并且为了最终用户的使用方便,它们大都被进一步的封装,形成了比较简单易用的操作平台。目前大数据技术平台有很多,归纳起来可以按照以下方式进行分类:

  (1)从大数据处理的过程来分:包括数据存储、数据挖掘分析、以及为完成高效分析挖掘而设计的计算平台,它们完成数据采集、ETL、存储、结构化处理、挖掘、分析、预测、应用等功能。

  (2)从大数据处理的数据类型来划分:可以分为针对关系型数据、非关系型数据(图数据、文本数据、网络型数据等)、半结构化数据、混合类型数据处理的技术平台。

  (3)从大数据处理的方式来划分:可以分为批量处理、实时处理、综合处理。其中批量数据是对成批数据进行一次性处理,而实时处理(流处理)对处理的延时有严格的要求,综合处理是指同时具备批量处理和实时处理两种方式。

  (4)从平台对数据的部署方式看:可以分为基于内存的、基于磁盘的。前者在分布式系统内部的数据交换是在内存中进行,后者则是通过磁盘文件的方式。

  此外,技术平台还有分布式、集中式之分,云环境和非云环境之分等。阿里云大数据平台构建在阿里云云计算基础设施之上,为用户提供了大数据存储、计算能力、大数据分析挖掘、以及输出展示等服务,用户可以容易地实现BI商业智能、人工智能服务,具备一站式数据应用能力。

  不同的大数据技术平台提供了对这些处理过程的支持,有的平台可能会支持多个过程,但是侧重点也不同,支持的深度也有所不同,因此有必要熟悉各种平台的功能,并做出比较分析,以便在实际应用中选择适合于自己需求的技术平台。

  选择一个合适的大数据技术平台是非常重要的,它能够使得大数据应用开发更加容易、让开发人员更集中精力在业务层面的数据分析与处理上。一些共性的基础问题,例如数据如何存储、如何检索、数据统计等,就可以由平台来完成。选择合适的大数据技术平台应当考虑以下因素:

  (1)平台的功能与性能:由于不同平台侧重的功能不同,平台的性能也就有很多需要考察的方面。比如对于存储平台来说,数据的存储效率、读写效率、并发访问能力、对结构化与非结构化数据存储的支持,所提供的数据访问接口等方面就是比较重要的。对于大数据挖掘平台来说,所支持的挖掘算法、算法的封装程度、数据挖掘结果的展示能力、挖掘算法的时间和空间复杂度等,是比较重要的指标。

  (2)平台的集成度:好的平台应该具有较高的集成度,为用户提供良好的操作界面,具有完善的帮助和使用手册、系统易于配置、移植性好。同时随着目前软件开源的趋势,开源平台有助于其版本的快速升级,尽快发现其中的bug,此外,开源的架构也比较容易进行扩展,植入更多的新算法,这对于最终用户而言也是比较重要的。

  (3)是否符合技术发展趋势:大数据技术是当前发展和研究的热点,其最终将走向逐步成熟,可以预见在这个过程中,并非所有的技术平台都能生存下来。只有符合技术发展趋势的技术平台才会被用户、被技术开发人员所接受。因此,一些不支持分布式、集群计算的平台大概只能针对较小的数据量,侧重于对挖掘算法的验证。而与云计算、物联网、人工智能联系密切的技术平台将成为主流,是技术发展趋势。

  大数据的处理过程可以分为大数据采集、存储、结构化处理、隐私保护、挖掘、结果展示(发布)等,各种领域的大数据应用一般都会涉及到这些基本过程,但不同应用可能会有所侧重。对于互联网大数据而言,由于其具有独特完整的大数据特点,除了共性技术外,采集技术、结构化处理技术、隐私保护也非常突出。

如何选择合适的大数据分析平台的类型相关推荐

  1. canoco5冗余分析步骤_打造高性能的大数据分析平台

    大数据时代,大数据的应用与挖掘,大数据的分析和决策,大数据在经济社会的运行轨道上发挥着愈来愈重要的作用.对于大数据分析,现在好多互联网金融公司和传统的商业银行.证券基金公司都非常看重.个个都想在大数据 ...

  2. 大数据分析平台搭建方式有哪些

    随着大数据时代的到来,数据价值的概念逐渐深入人心,许多企业开始搭建自己的大数据分析平台,以便在数据洪流中把握行业未来的发展方向.做任何事情之前,首先要设定目标和思路,然后根据确定的目标.思路和实际情况 ...

  3. 企业如何实现大数据分析平台

    搭建大数据分析平台的工作是循序渐进的,不同公司要根据自身所处阶段选择合适的平台形态,没有必要过分追求平台的分析深度和服务属性,关键是能解决当下的问题. 大数据分析平台是对大数据时代的数据分析产品(或称 ...

  4. 企业数字化转型的核心—大数据分析平台

    随着物联网.大数据的快速发展,数据价值的发掘与应用被企业开始重视,如信息化建设一样,企业开启了新一轮数字化转型,物联网.业务融合.大数据平台建设如火如荼的进行.那么在数字化转型中,决定企业成败的核心是 ...

  5. 如何打造高性能大数据分析平台

    大数据分析系统作为一个关键性的系统在各个公司迅速崛起.但是这种海量规模的数据带来了前所未有的性能挑战.同时,如果大数据分析系统无法在第一时间为运营决策提供关键数据,那么这样的大数据分析系统一文不值.本 ...

  6. 【金猿案例展】某国家级研究所——组学大数据分析平台建设

    荣联科技集团案例 本案例由荣联科技集团投递并参与"数据猿年度金猿策划活动--2020大数据产业创新服务企业榜单及奖项"评选. 大数据产业创新服务媒体 --聚焦数据 · 改变商业 大 ...

  7. 工业大数据分析平台的应用价值探讨

    大数据经过多年的潜心发展,在当今可以说是进入到了一个快速发展期.各种围绕大数据的应用开发也迅速火热起来了.政务大数据解决方案.企业级大数据解决方案.智慧城市停车大数据解决方案等已经开始被应用.5月份一 ...

  8. mmTrix大数据分析平台构建实录--转

    在数据分析中,有超过90%数据都是来自于非结构化数据,其中大部分的是日志,如运维.安全审计.用户访问数据以及业务数据等,但随着互联网快速的发展,数据规模也是水涨船高,从早前的GB级到现在的TB级,甚至 ...

  9. 【转】使用Apache Kylin搭建企业级开源大数据分析平台

    http://www.thebigdata.cn/JieJueFangAn/30143.html 本篇文章整理自史少锋4月23日在『1024大数据技术峰会』上的分享实录:使用Apache Kylin搭 ...

最新文章

  1. 发展之道:简单与专注 王泽宾
  2. 小块头大性能才能得到用户的青睐
  3. 【干货】搭建社区运营团队的一些经验和“血的教训”
  4. 三维重建:QT+OpenNI+Kinect图像校正
  5. 九九乘法表编程上三角python_java语言打印上三角和下三角,进一步得到九九乘法表...
  6. 基本农田卫星地图查询_#重庆朝天门#谷歌百度腾讯高德“卫星地图”PK,谷歌更胜一筹...
  7. MySQL查看表占用空间大小(转)
  8. JS ||(或运算)详解
  9. FFmpeg+SDL纯视频播放器
  10. 珍大户《认知世界的经济学》学习笔记 -- 第17课 影响消费者的因素,更新时间2021年03月18日21:53:57
  11. Android初学者的疑惑与“死板”的Android初学之路
  12. 计算机内存容量影响游戏的吗,内存容量对整机游戏性能影响有多大?看完秒懂...
  13. select函数用法
  14. 谷歌浏览器在新页面打开_如何在Google文档中更改页面方向
  15. 美国法案TSCA测试,TSCA报告涵盖内容
  16. 奔跑吧linux内核-使用qemu运行linux系统
  17. 微信小程token_微信小程序登录换取token
  18. Verilog左移位
  19. xp服务器协议,Windows XP提供了哪些可选的网络协议和组件?
  20. 开尔文函数 matlab,KELVIN二维/ RS传热求解器

热门文章

  1. Windows 8(Windows Developer Preview)先体验
  2. 关于C#的GetHashCode
  3. 程序员面试金典——9.4集合的子集
  4. Leetcode 242. 有效的字母异位
  5. [课堂实践与项目]IOS优先级的计算器
  6. python pil 模块将随机字符生成验证码
  7. 蜕变成蝶~Linux设备驱动中的并发控制
  8. disable menu item
  9. 【JAVA】FreeMarker学习1(Ftl)
  10. 比特币科普:区块链技术神奇在哪里?