创建与分配Executor的方式根据各种资源调度方式的不同而有差异,但拿到Executor后每种资源调度方式下的Executor的运作都一样,并由Executor完成最终的计算
Task在Executor中执行时涉及到依赖环境的创建和分发、任务执行、任务结果的处理、Driver端的处理(书中有详细介绍,但和前面Scheduler感觉有重复部分)
Executor的工作参数设置:
spark.executor.memory:
配置Executor最多使用的内存大小,原理是设置Executor的JVM Heap尺寸实现。由于内存资源有限,此参数设置过大会导致部分任务分配不到资源,设置过小会产生频繁的垃圾回收和读写磁盘
每个Executor可以支持的Task数量取决于持有的CPU core的数量
准确评估数据集,要看在BlockManager的日志中的RDD cache,每个cache分区大小
内存比较紧张时,可以合理规划分区任务的数据规模,如增加分区数可增加任务数,减小每个任务的处理量
日志相关:
spark.eventLog.enabled设置为true打开日志保存到本地,方便调试和追踪问题,但日志需要定时清理,清理策略可以设置:
spark.executor.heartbeatInterval:
Executor和Driver的心跳间隔,就是汇报运行和统计信息的间隔

转载于:https://www.cnblogs.com/kinghey-java-ljx/p/8522589.html

深入探究Spark -- 了解Executor和参数配置相关推荐

  1. spark standalone提交任务参数配置

    一共申请6个核 不指定每个executor的cores 3个executor * 2 = 6 cores 一共申请6个核 并且指定每个executor的cores 6个executor * 1 = 6 ...

  2. Spark on Yarn:任务提交参数配置

    当在YARN上运行Spark作业,每个Spark executor作为一个YARN容器运行.Spark可以使得多个Tasks在同一个容器里面运行. 以下参数配置为例子: spark-submit -- ...

  3. Spark性能相关参数配置详解

    随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化. 由于篇 ...

  4. Spark 性能相关参数配置详解-任务调度篇

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 随着Spark的逐渐成熟完善, ...

  5. Spark 性能相关参数配置详解-压缩与序列化篇

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 随着Spark的逐渐成熟完善, ...

  6. Spark 性能相关参数配置详解-Storage篇

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 随着Spark的逐渐成熟完善, ...

  7. Spark 性能相关参数配置详解-shuffle篇

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 随着Spark的逐渐成熟完善, ...

  8. Spark性能调优系列:Spark参数配置大全(官网资料)

    Spark参数配置大全 Spark提供了三个位置来配置系统 Spark属性控制大多数应用程序参数,可以使用SparkConf对象或Java系统属性来设置. 通过conf/spark-env.sh每个节 ...

  9. 大数据培训:Spark性能调优与参数配置

    Spark性能调优-基础篇 众所周知,正确的参数配置对提升Spark的使用效率具有极大助力,帮助相关数据开发.分析人员更高效地使用Spark进行离线批处理和SQL报表分析等作业. 推荐参数配置模板如下 ...

最新文章

  1. Android异步消息机制
  2. Java进阶之光!mysql安装包安装教程
  3. 一個便宜的高负载网站架构
  4. java基础9(IO流)-File类
  5. easyui首页模板
  6. light动名词_动名词的用法英语语法大全
  7. 谈程序猿的技术能力(Technology)和工程能力(Engineering)
  8. Lombok requires enabled annotation processing
  9. docker搭建searx_『颜值即正义』看小睿“自建搜索引擎”
  10. Jmeter .jmx 改为.jtl
  11. 怎么获取计算机用户权限,W7电脑系统怎么获取administrator权限
  12. L1-079 天梯赛的善良
  13. git的安装与配置教程-超详细版
  14. 【毕业设计】基于单片机的门禁系统 - 嵌入式 物联网
  15. ROS入门之Publisher的创建
  16. 蓝海、红海指的是什么
  17. 【汽车行业中的RKE/PKE】
  18. 笨办法学Python第一天
  19. 第三次人工智能热潮和企业SaaS
  20. python安装pymongo_Python: Windows 7 64位 安装、使用 pymongo 3.2

热门文章

  1. 代币转账_手把手教你从源代码开始搭建多节点以太坊私链(五)部署智能合约及代币发行...
  2. 实现费用管理 mysql_电信资费管理系统的设计与实现(NetBeans,MySQL)
  3. Android开发应该了解的Binder原理,专题解析
  4. 使用eclipse编写JAVA程序
  5. 用matlab提取lbp特征,求教大神给解释一下LBP特征提取每部分程序是干什么的
  6. log4jdbc mysql jdbc_spring boot 集成log4jdbc 查看完整sql
  7. mysql遵循acid_mysql关系型数据库遵循ACID规则
  8. 企业网络推广——企业网络推广专员提高网站更新讲策略
  9. 新站如何使用标签才对SEO优化更有利
  10. keil c语言模块化编程,keil C模块化编程总结