Yarn在MapReduce中的工作机制
- 目录
- 前言:
- 1、YARN概述
- 2、mapreduce&yarn的工作机制
- 总结:
目录
前言:
在了解Yarn在MR中的作用的时候需要先了解Yarn是什么。
1、YARN概述
Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而mapreduce等运算程序则相当于运行于操作系统之上的应用程序
YARN的重要概念
1、 yarn并不清楚用户提交的程序的运行机制
2、 yarn只提供运算资源的调度(用户程序向yarn申请资源,yarn就负责分配资源)
3、 yarn中的主管角色叫ResourceManager
4、 yarn中具体提供运算资源的角色叫NodeManager
5、 这样一来,yarn其实就与运行的用户程序完全解耦,就意味着yarn上可以运行各种类型的分布式运算程序(mapreduce只是其中的一种),比如mapreduce、storm程序,spark程序,tez ……
6、 所以,spark、storm等运算框架都可以整合在yarn上运行,只要他们各自的框架中有符合yarn规范的资源请求机制即可
7、 Yarn就成为一个通用的资源调度平台,从此,企业中以前存在的各种运算集群都可以整合在一个物理集群上,提高资源利用率,方便数据共享。
2、mapreduce&yarn的工作机制
客户端提交程序到yarn的整个过程如下图所示:
主要分为以下几个关键步骤:
1、客户端发送Application的提交请求到ResourceManager。
2、客户端收到返回的存储位置信息后,将相关的文件存储到HDFS对应的位置(实际就是mrAPPmaster所在的node上的位置)
3、向yarn申请启动mrappmaster。
4、yarn将提交的申请信息进行封装转化为一个Task放进队列中等待处理。
5、相应的node领到task,运行mrappmaster,将相关的Job信息下载到本地。
6、mrappmaster向yarn申请运行maptask所需的node,各个node创建各自的容器container来处理maptask。
7、mrappmaster将job的相关信息发送的各个maptask所在的node上。
8、maptask的分区排序。
9、mrappmaster向yarn申请运行reducetask所需node
10、reducetask阶段
11、mrappmaster向resourcemanager申请注销自己。
yarn有内存分离机制会给一个进程提供一块固定的资源空间(CPU+RAM)来运行,类似于一个容器,此处叫做container,一个节点包含多个container。
总结:
最主要了解yarn在整个MR过程中起到的作用:即先通过Yarn来启动mrappmaster,再通过mrappmaster来申请对应的Maptask和ReduceTask的资源,(内部处理任务的单元是一个Container容器)任务执行完毕后mrappmaster向Yarn申请注销自己。
Yarn在MapReduce中的工作机制相关推荐
- MapReduce1和Yarn的工作机制
Hadoop中的MapReduce的工作机制分为两种: MapReduce 1 也就是Hadoop 2.0之前的工作机制 YARN MapReduce 1 构成 MapReduce 1最主要的其实就是 ...
- Yarn基本架构和工作机制
Yarn基本架构和工作机制 概念 Yarn基本架构 ResourceManager (RM)作用 NodeManager (NM)作用 ApplicationMaster (AM)作用 contain ...
- Hadoop之Yarn工作机制详解
Hadoop之Yarn工作机制详解 目录 Yarn概述 Yarn基本架构 Yarn工作机制 作业提交全过程详解 1. Yarn概述 Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于 ...
- 经典MapReduce作业和Yarn上MapReduce作业运行机制
一.经典MapReduce的作业运行机制 如下图是经典MapReduce作业的工作原理: 1.1 经典MapReduce作业的实体 经典MapReduce作业运行过程包含的实体: 客户端,提交MapR ...
- 【MapReduce】MapReduce工作机制
一个mapreduce作业,一般分为两阶段执行:map阶段和reduce阶段,下面分别对这两阶段进行介绍. Map阶段 Map阶段又分为五部分:读取文件阶段,MapTask阶段,collect阶段,溢 ...
- 第6章-MapReduce的工作机制-笔记
为什么80%的码农都做不了架构师?>>> 作业的提交 可以只用一行代码来运行一个MapReduce作业: JobClient.runJob(conf). 作业的调度 Hadoo ...
- MapTask运行机制详解以及Map任务的并行度,ReduceTask 工作机制以及reduceTask的并行度,MapReduce总体工作机制
MapTask运行机制详解 整个Map阶段流程大体如图所示 简单概述 inputFile通过split被逻辑切分为多个split文件, 通过Record按行读取内容给map(用户自己实现的)进行处理, ...
- mapreduce工作流程_详解MapReduce中的五大编程模型
前言 我们上一节讲了关于 MapReduce 中的应用场景和架构分析,最后还使用了一个CountWord的Demo来进行演示,关于MapReduce的具体操作.如果还不了解的朋友可以看看上篇文章:[初 ...
- 【C 语言】文件操作 ( C 语言中的文件操作函数 | 磁盘与内存缓冲区 | 缓冲区工作机制 )
文章目录 一.C 语言中的文件操作函数 二.磁盘与内存缓冲区 三.缓冲区工作机制 一.C 语言中的文件操作函数 读取 文本文件 可以使用 getc , fgets , fscanf 函数 , 向 文本 ...
最新文章
- 单链表-单链表拆分为两个线性表(尾插法+尾插法)
- Matlab中将数据保存为txt或dat格式四种方案
- MapReduce案例-wordcount-步骤分析
- MySql中 DELIMITER
- 中国磷矿市场趋势报告、技术动态创新及市场预测
- Mac OSX 下 mysql 影响关系的问题处理
- 5V升压8.4V芯片电路图,5V充电7.4V电池
- 软考(22)-网络存储、网络安全、网络规划与设计
- php批量修改文件夹名称的功能,php实现批量修改文件名称
- XCTF-攻防世界CTF平台-Web类——19、mfw(.Git源代码泄露、php的assert断言)
- 《火车运煤问题》分析
- Warshall算法代码实现
- 如何让自己的exe程序开机自启动
- 香港十大炒黄金交易公司排名2020版一览
- Error relaunching VirtualBox VM process:5错误解决
- Workbook 对象 应用示例
- [C语言]插入字符A:用字符数组作函数参数,编程实现在字符串每个字符间插入一个空格的功能。
- 让人少走弯路的MySQL 8.0安装教程
- div添加阴影(盒子阴影)box-shadow各参数含义
- 计算机病毒生命周期,计算机病毒的生命周期 -电脑资料
热门文章
- 解决:Error while compiling statement: FAILED: SemanticException [Error 10007]: Ambiguous column refere
- [AHOI2009]最小割(最大流+tarjan)
- 关于XShell 启动虚拟机的weblogic并在本地打开oracle-weblogic 有关部署
- day8-异常处理与网络编程
- 第十章 动态选路协议
- iframe里面的元素触发父窗口元素事件的jquery代码 转
- 数据结构比较型排序算法分析及选择
- 网络上常用的一些网站
- POJ 1852 Ants 分析
- 面向对象-多态,反射