学习路径

一、平台基础

1.1、大数据
了解什么是大数据,大数据入门,以及大数据介绍。
以及大数据中存在的问题,包括存储,计算的问题,有哪些解决策略。
1.2、Hadoop平台生态圈
熟悉了解开源Hadoop平台生态圈,以及第三方大数据平台,查找一些Hadoop入门介绍博客或者官网,了解:
What’s Hadoop
Why Hadoop exists
How to Use Hadoop
1.3、Hadoop家族成员
Hadoop是一个庞大的家族,包含存储,计算等一系列产品组件,需要了解其中的一系列组件,包括HDFS,MapReduce,Yarn,Hive,HBase,ZooKeeper,Flume,Kafka,Sqoop,HUE,Phoenix,Impala,Pig,Oozie,Spark等,知道其干什么,维基百科定义。
1.4、HDFS
分布式存储HDFS,了解HDFS架构,HDFS的存储机制,各节点协作关系需理解清楚。
1.5、Yarn
分布式资源管理Yarn,熟悉Yarn架构,以及如何进行资源管理的机制。
1.6、MapReduce
分布式计算MapReduce,对MapReduce底层架构,处理方案进行了解,计算

Hadoop学习路径相关推荐

  1. Hadoop学习笔记(1) ——菜鸟入门

     Hadoop学习笔记(1) --菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分布式系统基础架构,由Apache基金会所开发.用户能够在不了解分布式底层细节的情况下.开发分布式 ...

  2. Hadoop学习笔记(1)

    原文:http://www.cnblogs.com/zjfstudio/p/3859704.html Hadoop学习笔记(1) --菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分 ...

  3. Hadoop学习笔记(8) ——实战 做个倒排索引

    Hadoop学习笔记(8) --实战 做个倒排索引 倒排索引是文档检索系统中最常用数据结构.根据单词反过来查在文档中出现的频率,而不是根据文档来,所以称倒排索引(Inverted Index).结构如 ...

  4. Hadoop学习笔记—4.初识MapReduce

    一.神马是高大上的MapReduce MapReduce是Google的一项重要技术,它首先是一个 编程模型 ,用以进行大数据量的计算.对于大 数据量的计算,通常采用的处理手法就是并行计算.但对许多开 ...

  5. Hadoop学习(二)——MapReduce\Yarn架构

    其他更多java基础文章: java基础学习(目录) 学习资料 理解Hadoop YARN架构 本文先讲MapReduce 1.x的框架.再讲MapReduce 1.x升级改进后MapReduce 2 ...

  6. hadoop学习记录

    一.Hadoop学习 Hadoop由hdfs和MapReducer组成,hadoop是主流的大数据基础架构 Hdfs是hadoop的一种分布式文件系统 MapReducer是hadoop的分布式计算方 ...

  7. Hadoop学习笔记—2.不怕故障的海量存储:HDFS基础入门

    一.HDFS出现的背景 随着社会的进步,需要处理数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是却不方便管理和维护->因此,迫切需要一种系统来管理多 ...

  8. Hadoop学习之MapReduce

    Hadoop学习之MapReduce 目录 Hadoop学习之MapReduce 1 MapReduce简介 1.1 什么是MapReduce 1.2 MapReduce的作用 1.3 MapRedu ...

  9. Hadoop学习之HDFS

    Hadoop学习之HDFS 1 HDFS相关概念 1.1 设计思路 分散存储,冗余备份. 分散存储:大文件被切割成小文件,使用分而治之的思想让多个服务器对同一个文件进行联合管理: 冗余备份:每个小文件 ...

  10. Hadoop学习之整体介绍及环境搭建

    Hadoop学习之整体介绍及环境搭建 1 大数据概述 1.1 什么是大数据 数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加 工的的原始素材. 大数据:传统处理方 ...

最新文章

  1. Windows 7的使用技巧或功能经典20条
  2. pycharm 自动生成文件注释和函数注释
  3. integer加1_利用Abaqus UEL开发自定义单元1
  4. [pytorch、学习] - 5.8 网络中的网络(NiN)
  5. springmvc中报错Request processing failed;
  6. PIFO到底是什么?【Programmable Packet Scheduling at Line Rate】
  7. 20150401--Dede+搜索页面,评论
  8. 网易漫画Swift混编实践
  9. 【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之RAC 工作原理和相关组件(三)...
  10. 原谅我曾经是搞化学的《帮助寒门家庭共度难关》
  11. 修改centos7的MAC地址
  12. 如何下载哔哩哔哩视频
  13. C语言Matrix编程题——[Recursion]D. Liang 8.2 Fibonacci number
  14. 异地容灾系统方案设计与分析
  15. 计算机画图怎样更改文字,如何在图片上改字|超简单的修改图片里文字方法
  16. Elasticsearch 第三方工具包Bboss的简单使用
  17. Tomcat与JDK版本的对应
  18. 大数据批量下载文件 代码
  19. Unity3d 周分享(13期 2019.3.23 )
  20. blog Manager 后台管理系统

热门文章

  1. 安卓使用Root权限实现后台模拟全局按键、触屏事件方法(类似按键精灵)
  2. python3ide使用方法_Python IDE
  3. 50: 加密与解密 、 AIDE入侵检测系统 、 扫描与抓包 、 总结和答疑
  4. 数学建模算法与应用学习(一)
  5. 高等代数——大学高等代数课程创新教材(丘维声)——2.4笔记+习题
  6. GWR模型报错汇总(arcgis与GWR4)
  7. 【word小技巧】将visio图插入到word中
  8. java图片旋转90度_Java实现图片内容无损任意角度旋转
  9. PHP伪原创文章自动生成,api生成伪原创-爱发狗一键伪原创生成原创文章
  10. 超神四年的王者荣耀 会被英雄联盟手游顺利推塔吗?