在部署spark分布的时候,中途遇见了很多问题,总结一下

1.启动了spark分布之后没有master,worker进程

2. 启动spark集群的时候提示“main” java.lang.UnsupportedClassVersionError:org/apache/spark/launcher/Main:Unsupported major.mior version 52.0

3. 访问sparkUI界面时出现无法访问此网站,ip拒绝了连接请求

4. 启动saprk-shell 的时候提示无法分配内存或spark-shel:44:6983 以杀死


1.启动了spark分布之后没有master,worker进程

在启动spark的时候,启动了start-all.sh ,启动过程也没有问题,但是jps 查看的时候master节点没有master进程,worke节点没有worker进程,一开始我以为是自己配置文件的时候哪里配置错了,但是检查了一遍之后没有发现哪里有问了,看了很多资料,最后才发现启动spark的时候路径错了,我以为start-all.sh就能够启动所有集群,但是在这里启动spark分布的时候,要在spark目录下执行 sbin/start-all.sh   才行

2. 启动spark集群的时候提示“main” java.lang.UnsupportedClassVersionError:org/apache/spark/launcher/Main:Unsupported major.mior version 52.0

  • 在启动spark 集群的时候即使jdk错误,但是java -version查看jdk的时候,是有自己安装的jdk版本信息的,也就是jdk环境变量配置是没有问题的。然后我又以为是我安装的jdk的版本问题,但是我三台主机都用的是同一个版本的jdk,然而HadoopMaser(主节点),HadoopSlave01(worker)能够启动成功,那就不是jdk版本的问题。

  • 然后我尝试在spark-env.sh 文件里边添加JDK的环境变量,在吧三台主机的日志里边的文件给删除之后。从新启动spark集群就成功了。
cd spark-2.4.8-bin-hadoop2.7/logs/
rm -rf *  #删除logs下的所有日志文件
#这里三台主机的日志文件都有删除sbin/stop-all.sh   #在HadoopMaster(master节点)关闭spark集群
cd spark-2.4.8-bin-hadoop2.7/conf/
vi spark-env.sh
#在文件中添加jdk的环境变量(三台主机都要分别添加)
export JAVA_HOME=/home/hadoop/software/jdk1.8.0_171#这里建议吧scala,hadoop,spark,的环境变量也给加上
export SCALA_HOME=/home/hadoop/software/scala-2. 11.8
export JAVA_HOME=/home/hadoop/software/jdk1.8.0_ 171
export Hadoop_INSTALL=/home/hadoop/software/hadoop-3.3.0
export HADOOP_CONF_ DIR=$Hadoop_INSTALL/etc/hadoop
export SPARK_LOCAL_DIRS=/home/hadoop/software/spark-2.4.8-bin-hadoop2.7
export SPARK_LOCAL_DIRS=/home/hadoop/software/spark-2.4.8-bin-hadoop2. 7
#这里路径对应改为自己的文件路径即可#三台主机都分别添加好了之后,从新启动spark集群就可以了
cd spark-2.4.8-bin-hadoop2.7
sbin/start-all.sh

3. 访问sparkUI界面时出现无法访问此网站,ip拒绝了连接请求

  • 在部署好hadoop的时候,访问sparkUI界面时出现无法王文此网站,ip拒绝了连接请求。一开始我以为是我的ip错误了,或者是master节点的ip和windows下电脑的ip不再同一个网段导致的。但是在检查之后发现ip没有错,也是和本机的ip在同一个网段的。后来看了很多博客之后都没有用。然后就只好静下心来找问题。

  • 之后我查看了master节点的日志,终于发现了问题。如下图,日志中提示MatserUI on port 8888。我才反应过来,我在配置shark-env.sh文件的时候,SPARK_MASTER_WEBUI=8888.
  • 从新访问sparkweb界面:192.168.141.184://8888 (吧8080换成8888,因为我配置的spark访问webUI的端口号是8888)  就可以了

4. 启动saprk-shell 的时候提示无法分配内存或spark-shel:44:6983 以杀死

  • 在启动saprk-shell内存的时候户提示无法分配内存或以杀死,这是因为虚拟机内存不足导致的,我看一些文章说的是吧每台虚拟机的内存改为2G即可,但是我看了自己的虚拟机,原本就是2G。

  • 后来我进入了spark-env.sh 把SPARK_WORKER_MEMORY=2g注释掉(注意,每台主机都要去注释掉)然后我是吧三台主机全部重启了,重新启动hadoop集群,启动saprk集群,之后再sprak-shell 之后就可以了。这里注释掉之后应该不用重启也是可以的,我不知道注释掉SPARK_WORKER_MEMORY=2g注释掉之后不重新启动可不可以,可以试一下。还有一种方法不注释掉SPARK_WORKER_MEMORY=2g也可以,把它改小一点就可以了。我没有试过,我看很多文章也是这样说的,应该是可以的,感兴趣的可以试一下。

  • 修改之后从新启动就成功了。


本篇文章就到这里了,这些都是自己平时遇到的问题或者自己用到的东西,然后就整理了一下,能帮助到你,若有不对或这描述不清楚的地方请指正。

Spark Standalone 全分布模式安装过程中常见问题相关推荐

  1. Spark Standalone 全分布模式安装及问题配置过程中常见问题

    Spark Standalone 全分不模式:既真正的集群模式,master和worker部署在不同的节点之上,一般至少需要3个节点(一个master和两个worker),需要三台主机,slave,s ...

  2. MQ消息队列(三)RabbitMQ及Erlang安装过程中常见问题

    上期讲了如何下载安装RabbitMQ及所需要的环境Erlang,这期我们讲一下我在安装过程中出现过的问题以及我的解决方法 一.安装路径中有中文名 当路径中包含中文名时会出现闪退的情况,解决方案如下: ...

  3. Spark Standalone 伪分布模式安装

    伪分布模式是基于Standalone模式来实现的,所以也叫Standalone伪分布模式.Spark在生产环节中,主要部署在安装linux系统的集群中.在linux系统中安装Spark需要先安装JDK ...

  4. 史上最详细的UEFI+GTP安装ubuntu18.04LTS全记录,涵盖安装过程中的各种问题,所有的问题都将在这里终结。

    首先,若还有朋友不知道UEFI,可以先百度了解一下.截止到现在2019年,90%的朋友所使用的电脑都支持UEFI,不支持UEFI的电脑应该已经退役的差不多了.所以当你百度了解UEFI之后,相信你会有想 ...

  5. plsql初始错误sql.net未正确安装_ANSYS | ansys18.0完整安装过程及常见问题解决方案[图文]...

    1.首先打开ansys18.0安装文件夹,一般情况下通过网络渠道下载的ansys18.0安装包会有四个文件夹,crack文件夹为授权配置文件夹,disk1.disk2.disk3文件夹为安装程序包. ...

  6. 群晖网络不通_群晖系统安装zerotier one进行内网穿透过程中常见问题及解决方法...

    群晖系统安装zerotier one进行内网穿透过程中常见问题及解决方法 2020-07-28 17:27:39 21点赞 330收藏 31评论 zerotier one是一款很好用的P2P内网穿透软 ...

  7. nc提示java过期_用友NC系统使用过程中常见问题和解决方法!财会必看!

    原标题:用友NC系统使用过程中常见问题和解决方法!财会必看! 用友NC系统使用过程中常见问题和解决方法: 1.无法安装客户端插件,不能进入NC系统登陆界面 问题现象 现象1:可以打开web界面,但无法 ...

  8. spark (3)Spark Standalone集群安装介绍

    (1)初学者对于spark的几个疑问 http://aperise.iteye.com/blog/2302481 (2)spark开发环境搭建 http://aperise.iteye.com/blo ...

  9. wincc不正确的过程数据服务器,WinCC安装过程中的问题及其解决办法

    西门子的工控软件,尤其像WinCC安装起来有时候并不是那么顺手,可能会遇到各种问题.WinCC安装之前,硬件和软件都应该正确配置,在安装过程中,WinCC安装程序会注意检查是否满足以下安装条件: 1. ...

最新文章

  1. s9.16作业,员工信息表
  2. 面试题-自旋锁,以及jvm对synchronized的优化
  3. java redis 主从 哨兵_Redis主从复制与哨兵机制
  4. 人工智能及其应用(第5版).蔡自兴-5章课后习题。【部分答案】
  5. Chrome 技术篇-console控制台检测xpath、css唯一性
  6. Servlet底层原理、Servlet实现方式、Servlet生命周期
  7. SpringBoot 自动开启事务原理
  8. 解决maven项目Cannot change version of project facet Dynamic web module to 3.0
  9. 预定义变量$_SERVER
  10. linux-权限更改-符号更改法-rwx
  11. java初入多线程6
  12. Springcloud 高效率本地加Redis双级缓存
  13. Python使用pandas对数据进行差分运算
  14. 120.三角形最小路径和
  15. 计算机等级考试二级VB基础教程
  16. 入侵服务器修改数据教程,入侵服务器 修改数据库
  17. Docker 使用手册
  18. Windows10 如何禁用或删除大的Hiberfil.sys和Pagefile.sys文件
  19. 【已解决】ocker: Error response from daemon: Conflict. The container name “/nginx“ is alrea.....
  20. 抛出异常及声明异常 自己定义一个异常

热门文章

  1. im中的定位消息 ios_仿微信的IM聊天时间显示格式(含iOS/Android/Web实现)[图文+源码]...
  2. ALSA子系统(六)------POP音排查
  3. lingo解决6个发点8个收点的最小运输费用问题
  4. VS Code python设置及jupyter快捷键设置
  5. Android NDK 开发环境搭建(二)----来源http://www.cnblogs.com/zdz8207/archive/2012/11/27/android-ndk-install.htm
  6. python jupyter安装_jupyter安装步骤
  7. 千万别把自己当回事,千万要把自己当回事
  8. udp网络程序-端口问题
  9. 关于复变函数积分--原函数法
  10. shell脚本运行jar包