从计算的角度来讲,数据处理过程中需要计算资源(内存 & CPU)和计算模型(逻辑)。执行时,需要将计算资源和计算模型进行协调和整合。

流程概括:
①准备资源
②创建Driver和Executor节点
②然后将应用程序的数据处理逻辑分解成一个一个的计算任务task。
③然后将任务task发到【已经分配资源】的计算节点executor上, 按照指定的计算模型进行数据计算。最后得到计算结果

1. 启动 Yarn 集群环境(准备资源)

2. Spark 通过申请资源创建调度节点Driver和计算节点Executor

Driver和Executor都是运行在NodeManager上面的 !
ResourceManager是用于管理的,所以真正运行任务的是NodeManager

3. Spark 框架根据需求将计算逻辑根据分区划分成不同的task任务

Driver用于在Executor节点之间调度task任务
多个RDD会组合形成关联,再分解为多个Task任务,并放到TaskPool任务池中(因为需要调度task任务)

4. 调度节点Driver将任务根据计算节点状态发送到对应的计算节点进行计算


( Executor 通过自身块管理器为用户程序中要求缓存的RDD提供内存式Cache存储 )

调度节点Driver会将Task从任务池中取出,然后根据节点状态、首选位置来发送到不同的Executor进行计算
从以上流程可以看出 RDD 在整个流程中主要用于将逻辑进行封装,并生成 Task 发送给Executor 节点执行计算

RDD的执行流程(简略)相关推荐

  1. 【大数据开发】SparkCore——Spark作业执行流程、RDD编程的两种方式、简单算子

    文章目录 一.Spark作业执行流程(重点) 二.RDD编程 2.1创建RDD的⼆种⽅式: 2.2Transformation算⼦ 2.3Action算子 三.简单算子(必须掌握) 3.1 map.m ...

  2. Spark Streaming 执行流程

    Spark Streaming 是基于spark的流式批处理引擎,其基本原理是把输入数据以某一时间间隔批量的处理,当批处理间隔缩短到秒级时,便可以用于处理实时数据流. 本节描述了Spark Strea ...

  3. 追源索骥:透过源码看懂Flink核心框架的执行流程

    https://www.cnblogs.com/bethunebtj/p/9168274.html 追源索骥:透过源码看懂Flink核心框架的执行流程 前言 1.从 Hello,World WordC ...

  4. Spark架构与作业执行流程简介

    2019独角兽企业重金招聘Python工程师标准>>> Spark架构与作业执行流程简介 博客分类: spark Local模式 运行Spark最简单的方法是通过Local模式(即伪 ...

  5. springsecurity原理执行流程_3. Spark原理-执行流程解析

    概念 Job 当在RDD上执行Action操作时就会提交一个Job.这个Job会将RDD分为多分,并将每份RDD提交到集群执行. Stage 当一个Job提交后将分解为多个Stage. Task 一个 ...

  6. 追源索骥:透过源码看懂Flink核心框架的执行流程--来自GitHub

    追源索骥:透过源码看懂Flink核心框架的执行流程 联系qq2499496272可进行删除,需要文件版本的私聊!!~ 文章目录 追源索骥:透过源码看懂Flink核心框架的执行流程 前言 1.从 ~~H ...

  7. Spark任务执行流程

    这是Spark官方给的图,大致意思就是: 四个步骤 1.构建DAG(有向无环图)(调用RDD上的方法) 2.DAGScheduler将DAG切分Stage(切分的依据是Shuffle),将Stage中 ...

  8. MySQL面试知识点追命连环问(一)执行流程存储引擎查询缓存

    ​来了,朋友们,追命连环问系列之MySQL部分开始了.准备好了吗?本次连环问主要设计以下四个方面: MySQL执行流程 MySQL存储引擎 表字段如何设计 查询缓存 一,MySQL的执行流程 面试官: ...

  9. MySQL的基础架构以及一条查询sql语句的执行流程

    详细介绍了Mysql的基础架构以及一条查询sql的执行流程. 如果不想作为一个只能简单的写写sql工程师,而是想要深入的学习MySQL,那么我们有必要首先从宏观的角度来了解MySQL的整体架构,只有把 ...

最新文章

  1. 一种简易实现磁悬浮吊坠方案
  2. 为什么叫python编程-中小学生为什么要学Python编程
  3. iperf3与netperf使用
  4. weblogic管理2 - 创建并启动一个managed server
  5. 超全!Python获取某一日期是“星期几”的6种方法!
  6. c语言调用sqlite
  7. 生存分析——泊松回归(LightGBM)实现生存分析(四)
  8. [Flash开发笔记] AS中保留多少位小数的函数
  9. mysql explain G_MySQL 性能优化神器 Explain 使用分析
  10. 通过定位position=fixed实现网页内容的固定层效果
  11. resnet网络结构图
  12. Linux网络系统之配置域名与主机名映射和常见网络命令
  13. c语言算摄氏温度和绝对温度,将华氏度转换为绝对温度C语言
  14. VMware vCenter vShield配置vxlan时候vib未安装
  15. 华为薪资等级结构表_2019年华为新员工薪酬 华为薪酬等级工资表
  16. 异步爬取有道词典(入门js逆向)
  17. OSChina 周一乱弹 ——强行把她拖到家里洗了个澡
  18. 技术债务研究综述X4
  19. 【蓝桥杯13】——PCF8591的应用(AD转换)
  20. 从图像中提取特定颜色区域。

热门文章

  1. 【SD】销售收入成本的确定
  2. 摩托罗拉Atrix预言了智能手机的现在和未来
  3. newScheduledThreadPool : scheduleAtFixedRate 与 scheduleWithFixedDelay 详解
  4. 按日期倒序排列,为空放在最上方展示
  5. 使用SSH连接Linux上的Oracle
  6. 历年TOEFL听力最常考的学类场景词汇
  7. 爬取wall.alphacoders.com下的英雄联盟壁纸,爬虫完整过程
  8. SQL Server主从数据库配置过程
  9. 微信小程序倒计时,计时器隐藏与显示
  10. 高级运维需要掌握的技能知识点