1,解压缩spark安装文件

tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module

2,修改spark目录名称

mv spark-3.0.0-bin-hadoop3.2 spark-yarn

3,修改hadoop的yarn-site.xml文件,新增下面内容

<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认
是 true -->
<property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value>
</property>
<!--是否启动一个线程检查每个任务正使用的虚拟内存量,如果任务超出分配值,则直接将其杀掉,默认
是 true -->
<property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
</property>

4,将hadoop的yarn-site.xml配置文件分发到其它机器

xsync yarn-site.xml

5,修改spark-yarn/conf/spark-env.sh配置文件

export JAVA_HOME=/opt/module/jdk1.8.0_144
YARN_CONF_DIR=/opt/module/hadoop/etc/hadoop

6,拷贝hive的hive-site.xml配置文件到spark conf目录下

cp /opt/module/hive-3.1.2/conf/hive-site.xml /opt/module/spark-yarn/conf/

7,拷贝mysql的驱动包&hadoop的lzo jar包到spark jars目录下

cp /opt/module/hive-3.1.2/lib/mysql-connector-java-5.1.27-bin.jar /opt/module/spark-yarn/jars/
cp /opt/module/hadoop-3.1.3/share/hadoop/common/hadoop-lzo-0.4.20.jar /opt/module/spark-yarn/jars/

8,重启hadoop集群

sbin/start-dfs.sh # 注意:启动yarn环境一定要在部署的节点启动
sbin/start-yarn.sh

Spark on Yarn环境搭建相关推荐

  1. Spark On YARN 环境搭建

    1.确保前边的环境都是否配置成功 搭建环境之前先确定自己的环境是否做好 1.jdk 1.8版本 2.HDFS MapReduce Hadoop 3.2.1 + 3.zookeeper 4.python ...

  2. Spark学习之路一——Spark基础及环境搭建

    Spark学习之路一--Spark基础及环境搭建 文章目录 一. Spark 概述 1.1 概述 1.2 优势特性 1.2.1 运行速度快 1.2.2 容易使用 1.2.3 通用性 1.2.4 运行模 ...

  3. Spark集群环境搭建(standalone模式)

    Spark集群环境搭建(standalone模式) 1. 实验室名称: 2. 实验项目名称: 3. 实验学时: 4. 实验原理: 5. 实验目的: 6. 实验内容: 7. 实验器材(设备.虚拟机名称) ...

  4. Spark详解(二):Spark完全分布式环境搭建

    1. 前言 本文搭建了一个由三节点(master.slave1.slave2)构成的Spark完全分布式集群,并通过Spark分布式计算的一个示例测试集群的正确性.本文将搭建一个支持Yarn的完全分布 ...

  5. spark入门及环境搭建

    简介 快速,通用,大数据处理分析框架 scala编写 采用DAG引擎,支持内存计算,速度快 可以运行scala,java,python,r等开发的程序 集成多种数据源 spark组件 spark co ...

  6. windows10下python开发spark应用的环境搭建

    环境搭建主要涉及到3方面,第1是安装,第2是环境变量的配置,第3是验证安装和配置是否成功,总的涉及到以下5个部分. 环境变量配置是在 此电脑 -> 属性 -> 高级系统设置 -> 高 ...

  7. linux spark单节点环境搭建,Linux下基于Hadoop的Spark1.2单机安装

    一,安装环境 硬件:虚拟机 操作系统:Centos 6.4 64位 IP:10.51.121.10 主机名:datanode-4 安装用户:root Hadoop:Hadoop2.6,Hadoop2. ...

  8. YARN环境搭建 之 一:CentOS7.0系统配置

    一.我缘何选择CentOS7.0 14年7月7日17:39:42发布了CentOS 7.0.1406正式版,我曾使用过多款Linux,对于Hadoop2.X/YARN的环境配置缘何选择CentOS7. ...

  9. Windows下Scala+Spark+IDEA+Hadoop环境搭建

    下载安装包,添加环境变量不再赘述. 注意spark和scala要对应版本.例如Spark使用官网下载的spark-2.4.4-bin-hadoop2.7,打开%SPARK_HOME%\jars文件夹, ...

最新文章

  1. Angular中怎样通过localStorage实现数据持久化-实现存储搜索历史为例
  2. 让Eclipse启动时显示选择workspace的对话框
  3. P2685 [TJOI2012]桥
  4. 三年经验前端社招——丰巢科技
  5. C++primer拾遗(第八章:IO库)
  6. stl向量_如何在C ++ STL中将数组元素复制到向量?
  7. 雷鸟邮件查找所有星标邮件_雷鸟的4种轻量级电子邮件替代品
  8. 日均保护原创超6万篇,腾讯“至信链”助企鹅号作者一键维权
  9. 通用业务平台设计(一):概览
  10. 原型模式(Prototype)C++实现
  11. 大数据之项目需求及架构设计
  12. java oracle sqlldr,oracle sqlldr
  13. kalman滤波理解一:理论框架
  14. 微信小程序云数据库的分页提取,解决提取大量数据的耗时问题
  15. 李南江 html链接,HTML5教程-多媒体标签-李南江
  16. matlab rtw 生成c代码,MATLAB Coder ——从MATLAB代码生成C/C++代码
  17. Window 时间同步 地址
  18. react项目中播放音频时扬声器图标动画效果
  19. 为什么有些大公司技术弱爆了?
  20. Jekins安装配置教程

热门文章

  1. 教育行业疫情分析研判报告撰写格式与模板详解
  2. Eclipse Scala环境的配置
  3. docker 搭建Jenkins持续集成平台
  4. #获取A股所有股票代码
  5. 2020年柒月份生活随笔
  6. SonarQube8.6 使用说明
  7. phpyun人才系统 短信配置教程
  8. 糖尿病视网膜病变风险随患者年龄和患病持续时间增长
  9. 华南农业大学课设——数据结构课设、Java课设、操作系统课设
  10. IE6/IE7 /IE8/Firefox/Chrome/Safa…