Spark在Ambari集群环境的使用
进入安装sparkclient的节点
hdfs准备一个文件
su - hdfs
vi text.txt
随便写几行东西
#创建目录
hdfs dfs -mkdir /user/hdfs/test
#上传文件
hdfs dfs -put test.txt /user/hdfs/test/
#检查文件是否在
hdfs dfs -ls /user/hdfs/test/
#检查内容是否对
hdfs dfs -cat /user/hdfs/test/test.txt
spark在yarn上运行参见官方文档
http://spark.apache.org/docs/latest/running-on-yarn.html
进入spark-shell
spark-shell --master yarn --deploy-mode client
统计下
scala> sc.textFile("/user/hdfs/test/test.txt").count()
res0: Long = 7
scala> sc.stop()
再次刷新Spark History Server页面即可
http://192.168.128.55:18081/?showIncomplete=false
spark-submit提交任务到yarn
spark-submit --class org.whq.sparkTest.MLTest1 \
--master yarn \
--deploy-mode cluster \
--driver-memory 4g \
--executor-memory 2g \
--executor-cores 1 \
--queue default \
spark244test_2.11-0.1.jar \
10
--deploy-mode cluster集群模式,多个application,每个application启动一个Driver在集群的多台worker(NodeManager)上启动。
--deploy-mode client客户端模式,多个application,每个application启动一个Driver只在本机运行,与集群产生大量通讯。
Spark在Ambari集群环境的使用相关推荐
- spark 入门及集群环境搭建
软件环境: VMware workstation 11.0 linux :CentOS 6.7 hadoop-2.7.3 jdk-1.0.7_67 spark-2.1.0-bin-hadoop2.7/ ...
- Spark 1.2 集群环境安装
我是在单机环境下修改下配置完成的集群模式 单机安装查看:http://blog.csdn.net/wind520/article/details/43458925 参考官网配置:http://spar ...
- Kafka:ZK+Kafka+Spark Streaming集群环境搭建(九)安装kafka_2.11-1.1.0
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
- Kafka:ZK+Kafka+Spark Streaming集群环境搭建(二十一)NIFI1.7.1安装
一.nifi基本配置 1. 修改各节点主机名,修改/etc/hosts文件内容. 192.168.0.120master192.168.0.121slave1192.168.0.122 slave2 ...
- Kafka:ZK+Kafka+Spark Streaming集群环境搭建(十二)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网。...
Centos7出现异常:Failed to start LSB: Bring up/down networking. 按照<Kafka:ZK+Kafka+Spark Streaming集群环境搭 ...
- Spark集群环境搭建(standalone模式)
Spark集群环境搭建(standalone模式) 1. 实验室名称: 2. 实验项目名称: 3. 实验学时: 4. 实验原理: 5. 实验目的: 6. 实验内容: 7. 实验器材(设备.虚拟机名称) ...
- kafka 基础知识梳理及集群环境部署记录
一.kafka基础介绍 Kafka是最初由Linkedin公司开发,是一个分布式.支持分区的(partition).多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特 ...
- Spark 0.8 集群(CentOS6.4)-简单统计测试
环境:CentOS 6.4, hadoop-2.0.0-cdh4.2.0, JDK 1.6, spark-0.8.0-incubating-bin-cdh4.tar.gz,Scala 2.9.3 1. ...
- Spark On YARN 集群安装部署
2019独角兽企业重金招聘Python工程师标准>>> 最近毕设需要用到 Spark 集群,所以就记录下了部署的过程.我们知道 Spark 官方提供了三种集群部署方案: Standa ...
最新文章
- 半小时训练亿级规模知识图谱,亚马逊AI开源知识图谱嵌入表示框架
- asp.net学习之ado.net(连接模式访问)
- 算法设计与分析——分支限界法——n皇后问题
- Bootstrap中的圆角图片效果
- 微内核和宏内核的区别(短小、精悍)
- python---之plt.subplot画图详解
- 中移4G模块-ML302-OpenCpu开发-2-MQTT连接阿里云
- UC 国际信息流推荐中的多语言内容理解
- Python入门--模块,from,import,自定义模块
- ConcurrentHashMap源码分析
- Linux隧道sit
- 第九届中国云计算大会讲师团探秘 ——数位院士领衔、近20个国家的学者共聚、多个行业领头人及专家参与, 共话云计算大数据生态、应用...
- 更换网站logo,超简单方法
- RISC-V入门笔记(新手必看!)
- 7-7 斐波那契(Fibonacci)数列前20项 (10 分)
- 为什么iPhone通常比Android具有更好的音质?
- JAVA数组扁平化整合_一文搞定数组扁平化(超全面的数组拉平方案及实现)
- dockerfile拉取私库镜像_从私有仓库拉取镜像
- 关于流量套利你需要知道的一切
- BillGates要走了,微软将继续前进