RDD的执行流程(简略)
从计算的角度来讲,数据处理过程中需要计算资源(内存 & CPU)和计算模型(逻辑)。执行时,需要将计算资源和计算模型进行协调和整合。
流程概括:
①准备资源
②创建Driver和Executor节点
②然后将应用程序的数据处理逻辑分解成一个一个的计算任务task。
③然后将任务task发到【已经分配资源】的计算节点executor上, 按照指定的计算模型进行数据计算。最后得到计算结果
1. 启动 Yarn 集群环境(准备资源)
2. Spark 通过申请资源创建调度节点Driver和计算节点Executor
Driver和Executor都是运行在NodeManager上面的 !
ResourceManager是用于管理的,所以真正运行任务的是NodeManager
3. Spark 框架根据需求将计算逻辑根据分区划分成不同的task任务
Driver用于在Executor节点之间调度task任务
多个RDD会组合形成关联,再分解为多个Task任务,并放到TaskPool任务池中(因为需要调度task任务)
4. 调度节点Driver将任务根据计算节点状态发送到对应的计算节点进行计算
( Executor 通过自身块管理器为用户程序中要求缓存的RDD提供内存式Cache存储 )
调度节点Driver会将Task从任务池中取出,然后根据节点状态、首选位置来发送到不同的Executor进行计算
从以上流程可以看出 RDD 在整个流程中主要用于将逻辑进行封装,并生成 Task 发送给Executor 节点执行计算
RDD的执行流程(简略)相关推荐
- 【大数据开发】SparkCore——Spark作业执行流程、RDD编程的两种方式、简单算子
文章目录 一.Spark作业执行流程(重点) 二.RDD编程 2.1创建RDD的⼆种⽅式: 2.2Transformation算⼦ 2.3Action算子 三.简单算子(必须掌握) 3.1 map.m ...
- Spark Streaming 执行流程
Spark Streaming 是基于spark的流式批处理引擎,其基本原理是把输入数据以某一时间间隔批量的处理,当批处理间隔缩短到秒级时,便可以用于处理实时数据流. 本节描述了Spark Strea ...
- 追源索骥:透过源码看懂Flink核心框架的执行流程
https://www.cnblogs.com/bethunebtj/p/9168274.html 追源索骥:透过源码看懂Flink核心框架的执行流程 前言 1.从 Hello,World WordC ...
- Spark架构与作业执行流程简介
2019独角兽企业重金招聘Python工程师标准>>> Spark架构与作业执行流程简介 博客分类: spark Local模式 运行Spark最简单的方法是通过Local模式(即伪 ...
- springsecurity原理执行流程_3. Spark原理-执行流程解析
概念 Job 当在RDD上执行Action操作时就会提交一个Job.这个Job会将RDD分为多分,并将每份RDD提交到集群执行. Stage 当一个Job提交后将分解为多个Stage. Task 一个 ...
- 追源索骥:透过源码看懂Flink核心框架的执行流程--来自GitHub
追源索骥:透过源码看懂Flink核心框架的执行流程 联系qq2499496272可进行删除,需要文件版本的私聊!!~ 文章目录 追源索骥:透过源码看懂Flink核心框架的执行流程 前言 1.从 ~~H ...
- Spark任务执行流程
这是Spark官方给的图,大致意思就是: 四个步骤 1.构建DAG(有向无环图)(调用RDD上的方法) 2.DAGScheduler将DAG切分Stage(切分的依据是Shuffle),将Stage中 ...
- MySQL面试知识点追命连环问(一)执行流程存储引擎查询缓存
来了,朋友们,追命连环问系列之MySQL部分开始了.准备好了吗?本次连环问主要设计以下四个方面: MySQL执行流程 MySQL存储引擎 表字段如何设计 查询缓存 一,MySQL的执行流程 面试官: ...
- MySQL的基础架构以及一条查询sql语句的执行流程
详细介绍了Mysql的基础架构以及一条查询sql的执行流程. 如果不想作为一个只能简单的写写sql工程师,而是想要深入的学习MySQL,那么我们有必要首先从宏观的角度来了解MySQL的整体架构,只有把 ...
最新文章
- 一种简易实现磁悬浮吊坠方案
- 为什么叫python编程-中小学生为什么要学Python编程
- iperf3与netperf使用
- weblogic管理2 - 创建并启动一个managed server
- 超全!Python获取某一日期是“星期几”的6种方法!
- c语言调用sqlite
- 生存分析——泊松回归(LightGBM)实现生存分析(四)
- [Flash开发笔记] AS中保留多少位小数的函数
- mysql explain G_MySQL 性能优化神器 Explain 使用分析
- 通过定位position=fixed实现网页内容的固定层效果
- resnet网络结构图
- Linux网络系统之配置域名与主机名映射和常见网络命令
- c语言算摄氏温度和绝对温度,将华氏度转换为绝对温度C语言
- VMware vCenter vShield配置vxlan时候vib未安装
- 华为薪资等级结构表_2019年华为新员工薪酬 华为薪酬等级工资表
- 异步爬取有道词典(入门js逆向)
- OSChina 周一乱弹 ——强行把她拖到家里洗了个澡
- 技术债务研究综述X4
- 【蓝桥杯13】——PCF8591的应用(AD转换)
- 从图像中提取特定颜色区域。