大数据的处理过程可以分为大数据采集、存储、结构化处理、隐私保护、挖掘、结果展示(发布)等,各种领域的大数据应用一般都会涉及到这些基本过程,但不同应用可能会有所侧重。对于互联网大数据而言,由于其具有独特完整的大数据特点,除了共性技术外,采集技术、结构化处理技术、隐私保护也非常突出。

大数据
  有很多算法和模型可以解决这些处理过程中的技术问题,并且为了最终用户的使用方便,它们大都被进一步的封装,形成了比较简单易用的操作平台。目前大数据技术平台有很多,归纳起来可以按照以下方式进行分类:

(1)从大数据处理的过程来分:包括数据存储、数据挖掘分析、以及为完成高效分析挖掘而设计的计算平台,它们完成数据采集、ETL、存储、结构化处理、挖掘、 分析、预测、应用等功能。

(2)从大数据处理的数据类型来划分:可以分为针对关系型数据、非关系型数据(图数据、文本数据、网络型数据等)、半结构化数据、混合类型数据处理的技术平台。

(3)从大数据处理的方式来划分:可以分为批量处理、实时处理、综合处理。其中批量数据是对成批数据进行一次性处理,而实时处理(流处理)对处理的延时有严格的要求,综合处理是指同时具备批量处理和实时处理两种方式。

(4)从平台对数据的部署方式看:可以分为基于内存的、基于磁盘的。前者在分布式系统内部的数据交换是在内存中进行,后者则是通过磁盘文件的方式。

此外,技术平台还有分布式、集中式之分,云环境和非云环境之分等。阿里云大数据平台构建在阿里云云计算基础设施之上,为用户提供了大数据存储、计算能力、大数据分析挖掘、以及输出展示等服务,用户可以容易地实现BI商业智能、人工智能服务,具备一站式数据应用能力。

不同的大数据技术平台提供了对这些处理过程的支持,有的平台可能会支持多个过程,但是侧重点也不同,支持的深度也有所不同,因此有必要熟悉各种平台的功能,并做出比较分析,以便在实际应用中选择适合于自己需求的技术平台。

选择一个合适的大数据技术平台是非常重要的,它能够使得大数据应用开发更加容易、让开发人员更集中精力在业务层面的数据分析与处理上。一些共性的基础问题,例如数据如何存储、如何检索、数据统计等,就可以由平台来完成。选择合适的大数据技术平台应当考虑以下因素:

(1)平台的功能与性能:由于不同平台侧重的功能不同,平台的性能也就有很多需要考察的方面。比如对于存储平台来说,数据的存储效率、读写效率、并发访问能力、对结构化与非结构化数据存储的支持,所提供的数据访问接口等方面就是比较重要的。对于大数据挖掘平台来说,所支持的挖掘算法、算法的封装程度、数据挖掘结果的展示能力、挖掘算法的时间和空间复杂度等,是比较重要的指标。

(2)平台的集成度:好的平台应该具有较高的集成度,为用户提供良好的操作界面,具有完善的帮助和使用手册、系统易于配置、移植性好。同时随着目前软件开源的趋势,开源平台有助于其版本的快速升级,尽快发现其中的bug,此外,开源的架构也比较容易进行扩展,植入更多的新算法,这对于最终用户而言也是比较重要的。

(3)是否符合技术发展趋势:大数据技术是当前发展和研究的热点,其最终将走向逐步成熟,可以预见在这个过程中,并非所有的技术平台都能生存下来。只有符合技术发展趋势的技术平台才会被用户、被技术开发人员所接受。因此,一些不支持分布式、集群计算的平台大概只能针对较小的数据量,侧重于对挖掘算法的验证。而与云计算、物联网、人工智能联系密切的技术平台将成为主流,是技术发展趋势。

当我们花很多时间去掌握熟悉某种技术平台后,可能新的更好的技术平台出现了,导致我们受累奔波于各种技术平台,因此,最好的策略就是全面系统地掌握大数据技术的原理和实现方案,这样学习新的技术平台就很容易上手。
  人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
1.大数据时代,主要需要什么类型的人才?
http://www.duozhishidai.com/article-1554-1.html
2.对于大数据开发的学习,最经典的学习路线是什么?
http://www.duozhishidai.com/article-1544-1.html
3.Hadoop是什么,主要有哪几部分组成和Hadoop的影响力
http://www.duozhishidai.com/article-1152-1.html
4.大数据在各行业的应用和趋势
http://www.duozhishidai.com/article-477-1.html
5.大数据人才定义和分类
http://www.duozhishidai.com/article-405-1.html


多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站

目前大数据技术平台有很多,主要可以分为哪几类?相关推荐

  1. 大数据技术平台主要分为哪几类

    大数据的处理过程可以分为大数据采集.存储.结构化处理.隐私保护.挖掘.结果展示(发布)等,各种领域的大数据应用一般都会涉及到这些基本过程,但不同应用可能会有所侧重.对于互联网大数据而言,由于其具有独特 ...

  2. 大数据建设意义_大数据技术平台建设方案(ppt)

    应急指挥一张图可视化平台方案(ppt) 大数据平台架构建设方案(图文) 大数据平台技术架构解决方案(ppt)大数据平台总体架构方案(ppt)大数据平台框架选型分析方案(图文)大数据可视化分析平台应用方 ...

  3. 大数据要分析的数据类型,主要分为哪几大类?

    1.交易数据(TRANSACTION DATA) 大数据平台能够获取时间跨度更大.更海量的结构化交易数据,这样就可以对更广泛的交易数据类型进行分析,不仅仅包括POS或电子商务购物数据,还包括行为交易数 ...

  4. 数据科学家和大数据技术人员工具包

    数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具.挖掘分析处理工具.其它常见工具等几百种,几十个大类,部分网址.为数据科学教育和知识分享,提高数据科 ...

  5. 志翔科技亮相2022数博会 工业大数据技术支撑电力数智化

    2022年5月26日,2022中国国际大数据产业博览会(简称"数博会")线上开展,工业大数据企业志翔科技亮相云展会,展示了公司工业大数据产品在电力行业的应用和成果.自2018年志翔 ...

  6. 【2015年第4期】基于大数据技术的P2P网贷平台风险预警模型

    基于大数据技术的P2P网贷平台风险预警模型 林春雨1,李崇纲1,许方圆2,许会泉1,石 磊1,卢祥虎1 (1. 北京金信网银金融信息服务有限公司 北京 100101:2. 国网能源研究院 北京 100 ...

  7. 全国职业院校技能大赛2022年大数据技术与应用平台搭建

    前言 根据全国职业院校技能大赛2022年大数据技术与应用规程整理大数据平台搭建部分,如果有错误指出请提出改正,谢谢 资料 赛程文件 链接:https://pan.baidu.com/s/1TAygWq ...

  8. 大数据技术系列:图解【大数据平台开发】

    导言 在前面的文章<「大数据技术体系」学习实践导览>中,概要式的梳理了大数据平台的业务目标,大数据平台的架构框架,大数据平台中常用的技术及工具,数据治理四方面的内容,算是对自身所了解大数据 ...

  9. 互联网时代,大数据技术与云计算平台结合发展、应用

    随着互联网信息技术水平的不断提高,以大数据.云计算等为代表的相关技术在各个领域和行业之中的应用越来越发挥着重要的作用.互联网信息时代的快速发展,各个行业在发展之中都会产生大量的数据.如何对数据进行存储 ...

最新文章

  1. SAP ECC6.0-中建信息版
  2. 关于《0 bug -- C/C++商用工程之道》的一处bug
  3. 优化Linux内核参数/etc/sysctl.conf sysctl 《高性能Linux服务器构建实战:运维监控、性能调优与集群应用》...
  4. 【机器视觉】 ifelse算子(已废弃)
  5. java字符流解析_Java IO(四):字符流详解
  6. strtus2.3 java.lang.NoSuchFieldException: DEFAULT_PARAM
  7. [渝粤教育] 广东-国家-开放大学 21秋期末考试财政学10573k1
  8. 【渝粤题库】国家开放大学2021春1334纳税筹划题目
  9. 面向对象编程 和 面向接口编程
  10. 计算机毕业设计ssm基于vue的健康餐饮管理系统的设计与实现
  11. 【电源科普】负载调整率
  12. 算法数据结构 | 只要30行代码,实现快速匹配字符串的KMP算法
  13. PS 拖入图片保持原大小
  14. 33种名车的标志及名称来历
  15. 扒一扒那些叫欧拉的定理们(四)——平面几何欧拉定理美学鉴赏
  16. Android N DisplayManager服务解析(二)
  17. 解决网页版权符号模糊不清
  18. 计算机c盘能分区吗,电脑C盘还可以分盘吗?
  19. C语言|博客作业10
  20. 如何在知网下载硕士、博士论文PDF?

热门文章

  1. 【论文笔记】ObjectBox: From Centers to Boxes for Anchor-Free Object Detection
  2. 算法提升:图的拓扑排序算法
  3. Java实现快速文件查重功能
  4. [ 实践 ] 将安卓微信聊天记录导出为可读格式的一些记录
  5. 计算机组成原理--运算方法:加减乘除
  6. 马云的微博名为什么和阿里巴巴无关?背后的原因让人敬佩!
  7. 成为PHP大牛的绝招 —— 君子生非异也,善假于物也
  8. 海康nvr 使用28181协议配置说明
  9. rust nom 一个文本解析器的使用
  10. 您的好友“AI护士小姐姐”已上线