当下 Hadoop 已经成长为一个庞大的生态体系,只要和海量数据相关的领域,都有 Hadoop 的身影。下图是一个 Hadoop 生态系统的图谱,详细列举了在 Hadoop 这个生态系统中出现的各种数据工具。

这一切,都起源自 Web 数据爆炸时代的来临。Hadoop 生态系统的功能以及对应的开源工具说明如下。

MapReduce

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Hgnrc637-1660641022681)(http://hadoop.dajiangtai.com/content/201/2.png)]

HDFS

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-K18S4Lb8-1660641022682)(http://hadoop.dajiangtai.com/content/201/3.png)]

Pig和Hive

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Nduw88fK-1660641022682)(http://hadoop.dajiangtai.com/content/201/4.png)]、

Pig:是一种编程语言,它简化了Hadoop常见的工作任务。Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义(如日志文件)。同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换。

Hive:在Hadoop中扮演数据仓库的角色。Hive添加数据的结构在HDFS(hive superimposes structure on data in HDFS),并允许使用类似于SQL语法进行数据查询。与Pig一样,Hive的核心功能是可扩展的。

Hadoop生态系统图相关推荐

  1. Hadoop生态系统介绍

    Hadoop生态系统 Hadoop1.x 的各项目介绍 1. HDFS 2. MapReduce 3. Hive 4. Pig 5. Mahout 6. ZooKeeper 7. HBase 8. S ...

  2. Hadoop 生态学习

    Hadoop 生态学习 转载于:https://www.cnblogs.com/liuys635/p/10828201.html

  3. Hadoop 生态系列之 Mapreduce

    阅读文本大概需要 5 分钟.文章稍长,建议收藏慢慢看. 目前 Hadoop 系列文章的规划就是这样,持续补充完善中- 同时可以访问 https://data.cuteximi.com Hadoop 生 ...

  4. Hadoop 生态系列之 HDFS

    目前 Hadoop 系列文章的规划就是这样,持续补充完善中... 同时可以访问 :https://data.cuteximi.com Hadoop 生态系列之1.0和2.0架构 Hadoop 生态系列 ...

  5. Hadoop 生态系列之 1.0 和 2.0 架构

    自学大数据有一段时间了,找工作历时一周,找到一家大厂,下周入职,薪资待遇还不错,公司的业务背景自己也很喜欢.趁着还没有入职,给大家争取先把 Hadoop 系列的文章总结完毕,可以当做科普文,也可以当做 ...

  6. 大数据之Hadoop生态系统概述

    一.什么是大数据         首先,我们来了解一下,什么是大数据?大数据(BigData)是指无法在一定时间内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞 ...

  7. Hadoop生态之Mapreduce

    今天给大家带来的是Hadoop生态中的Mapreduce,看到这里诸佬们可能就有疑惑了呢,啥是Mapreduce?小小的脑袋大大的疑惑. 在上篇博客中博主使用了王者来举例子,如果把Hadoop当作王者 ...

  8. HBase与Hadoop生态其他组件的联系

    1.1 定义 HBase是一种分布式.可扩展.支持海量数据存储的NoSQL数据库. 分布式体现:底层存储在HDFS:集群中的Regionserver服务器也是分布式运行.可扩展体现:在建表的时候无需指 ...

  9. Python + 大数据-Hadoop生态-Linux(一)-环境搭建和Vi

    Python + 大数据-Hadoop生态-Linux(一)-环境搭建和Vi 今日课程学习目标 1.了解Linux操作系统发展介绍.安装配置 2.掌握SSH原理机制.Linux文件上传下载 3.掌握L ...

最新文章

  1. 成功解决Remix Mock compiler: Source not found
  2. hibernate--
  3. Android 分享功能大全
  4. 如何清除html代码里的空格,如何从html源代码中删除空格
  5. PHP对象和接口抽象类注意事项
  6. Oracle 11gR2 RAC TNS-12542: TNS:address already in use 故障一例
  7. win10 快速访问存在 2345Downloads 删除解决方案
  8. OC4J、UCP、CGI(引用)
  9. 【小样本·多分类】如何解决「小样本」+「多分类」问题?
  10. VS2015 编译问题记录(更新)
  11. 冒泡排序c++_学习笔记-详解冒泡排序
  12. dhtmlxgantt|dhtmlx甘特图|最新版Crack
  13. [Windows] Visio 图形怎么旋转到指定角度?
  14. linux wifi音箱,基于Orangpi Zero和Linux ALSA实现WIFI无线音箱(一)
  15. 3W 字 Docker 容器技术大科普
  16. Morris 中序遍历
  17. Win11使用PCVR时性能问题已修复 可手动安装解决
  18. 2017计科01-08编译原理模拟测试2--chap03
  19. 自用大智慧策略高端版本
  20. UVA 167(The Sultan's Successors)八皇后回溯

热门文章

  1. 谁不需要赚钱 -- 想,还要敢想
  2. 安卓性能优化(3)异常处理应用瘦身
  3. linux文字界面浏览器,文字式网页浏览器w3m (默认快捷键列表)
  4. Labview字符串函数——匹配模式(函数)
  5. oracle sqlplus 变量赋值,sqlplus赋值给shell
  6. JS如何阻止冒泡事件
  7. oracle数据库validate,使用RMAN VALIDATE验证数据和备份
  8. mybatis连接池的3种配置方式(POOLED,UNPOOLED,JNDI)
  9. 黑胶歌曲没权限,看我python大展神通,一分钟一个歌单
  10. linux sigpipe信号,Linux下SIGPIPE信号及其处理