今天的你不付昨天的辛苦,今天的辛苦定会拥抱明日的幸福,
每一次的成长,都要给自己以鼓励,每一次的突破,都给自己以信心,万花丛中我不是最美,但我有我的自信
————————————送给一直努力的你
今天的学习:
Spark利用(idea+maven+scala)创建wordcount打包jar并在spark on yarn上运行——Spark的开发
生产中就是这么玩的:
一:我们先用 idea+maven+scala创建wordcount

package g5.learningimport java.net.URI
import org.apache.hadoop.conf.Configuration
import org.apache.hadoop.fs.{FileSystem, Path}
import org.apache.spark.{SparkConf, SparkContext}
object LogServerScala {def main(args: Array[String]): Unit = {val sparkConf = new  SparkConf()// .setMaster("local[2]")
//      .setAppName("LogServerScala")//这里不能写本地,把文件写死了val sc = new SparkContext(sparkConf)//输入args(0) 输出:args(1)val uri = new URI("hdfs://hadoop001:9000")//这个过程是为了在output可以循环使用,如果存在就删掉val fileSystem = FileSystem.get(uri,sc.hadoopConfiguration,"hadoop")if (fileSystem.exists(new Path(args(1)))){fileSystem.delete(new Path(args(1)),true)}val lines = sc.textFile(args(0))lines.map(x => {val temp = x.split("\t")(temp(0),1L)//(url,count)}).reduceByKey(_+_).saveAsTextFile(args(1))sc.stop()fileSystem.close()//文件系统最后也一定要关掉}
}

代码的写入,要注意一些问题,否则后期运行时会报很多错误的
二:打包
View ==>Tool Windows ==> Maven Projects ==> package


三:
上传jar包
E:\ruozedata_workspace\g5spark1\target\test-classes
你对应的jar路径
re -be上传jar包

[hadoop@hadoop001 shell]$ vi log-yarn.shexport HADOOP_CONF_DIR=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
$SPARK_HOME/bin/spark-submit \
--master yarn \
--class g5.learning.LogServerScala \
--name LogServerScala \
/home/hadoop/shell/g5spark1-1.0.jar \
hdfs://hadoop001:9000/logs/input/ hdfs://hadoop001:9000/logs/output1

这里要有相关的配置
四:spark on yarn上运行

[hadoop@hadoop001 shell]$ vi log-yarn.sh
[hadoop@hadoop001 shell]$ ./log-yarn.sh

我们去控制台看一下:


成功

Spark利用(idea+maven+scala)创建wordcount打包jar并在spark on yarn上运行——Spark的开发相关推荐

  1. java spark yarn_《Spark官方文档》在YARN上运行Spark

    原文链接 Spark在 0.6.0版本后支持在YARN(hadoop NextGen)上运行,并且在后续版本中不断改进. 在YARN上启动Spark 首先,确认 HADOOP_CONF_DIR或YAR ...

  2. Spark 在YARN上运行

    在YARN上运行Spark 安全 在YARN上启动Spark 添加其他JAR 准备工作 组态 调试您的应用程序 Spark特性 重要笔记 的Kerberos YARN特定的Kerberos配置 Ker ...

  3. Spark在Yarn上运行Wordcount程序

    过往记忆专注于Hadoop.Spark.Hive.Flume.Hbase,QQ交流群:138615359 首页 Hadoop Spark Hive Hbase Flume 面试题 面试题 数据结构 算 ...

  4. 小白学习Spark03-在集群上运行Spark

    03 在集群上运行Spark 3.1 Spark运行架构 3.1.1 驱动器节点 3.1.2 执行器节点 3.1.3 集群管理器 3.1.4 启动Spark程序 3.1.5 小结 3.2 使用spar ...

  5. Spark Standalone -- 独立集群模式、Spark 提交任务的两种模式、spark在yarn上运行的环境搭建、自己写的spark代码如何提交到yarn上并运行...

    目录 Spark Standalone -- 独立集群模式 Standalone 架构图 Standalone 的搭建 1.上传.解压.重命名 2.配置环境变量 3.修改配置文件 conf 4.同步到 ...

  6. DolphiScheduler平台上运行spark程序时,外部参数设置

    DolphiScheduler平台上运行spark程序时,外部参数设置 近期使用DS平台执行spark程序,遇到了部分参数设置的问题,代码中需要外部传入一个参数procDate(处理日期),具体设置如 ...

  7. Spark学习笔记——在集群上运行Spark

    Spark运行的时候,采用的是主从结构,有一个节点负责中央协调, 调度各个分布式工作节点.这个中央协调节点被称为驱动器( Driver) 节点.与之对应的工作节点被称为执行器( executor) 节 ...

  8. maven 插件使用之:打包jar到lib

    2019独角兽企业重金招聘Python工程师标准>>> <plugin> <groupId>org.apache.maven.plugins</grou ...

  9. 使用 Sonatype Nexus 3 搭建 Maven 私服、本地私有 Maven 仓库,Gradle 打包 jar 、aar 后自动上传到 Nexus Maven 仓库配置

    1 下载 Nexus 3 https://www.sonatype.com/download-oss-sonatype 官网 (2019年7月18日更新:网站改版了 下载地址:https://down ...

最新文章

  1. early EOF fatal: index-pack failed
  2. SourceInsight配置
  3. Mac OS X Terminal 101:终端使用初级教程以及Xcode
  4. Create React App 2.0 华丽登场
  5. Python连接MySQL数据库之pymysql模块使用
  6. Android什么时候用抽象类什么时候用接口
  7. SQL Server商业智能中ODS表和Dim表必须有的字段
  8. uniapp---为什么使用uniapp_以及uniapp开发的app展示_使用hbuilderx简单搭建一个uniapp_一次开发_小程序_Android_IOS_快应用通用工作笔记002
  9. 后勤管理系统-在线报修系统
  10. Arduino Nano 自制显示器 “流光溢彩” 外设教程(新人向)
  11. 报错:/ma.jsp (line: [1], column: [45]) The JSP specification requires that an attribute name is preced
  12. NYOJ 412 Same binary weight题解
  13. 面向大规模商业系统的数据库设计和实践
  14. 夜神模拟器使用命令行直接运行指定的模拟器
  15. linux宝塔下如何强制ssl,宝塔面板一键安装SSL证书强制HTTPS访问设置
  16. JS中Object.entries()方法
  17. python银行利息问题_(完整版)存款利率问题应用题
  18. ios微信一直显示未连接到服务器,关于微信分享显示“正在连接”,“未验证应用”以及未正确加载apple-app-site-association配置文件问题说明...
  19. 你觉得学 Python 还是 Java 更好找工作?
  20. 聚类分析实验报告作业

热门文章

  1. 社区活动 | Apache Flink 1.9 版本即将发布,新版本有哪些新特性?
  2. @PathVariable、@RequestHeader与@CookieValue注解的使用案例
  3. 什么是UPS电源系统
  4. Android-解决ViewFlipper与ScrollView滑动响应事件拦截的问题【转】
  5. stderr 用法 linux,linux – 如何在使用“tee”时使用管道将stderr写入文件?
  6. bootstrap学习记录
  7. 窄脉冲matlab实现,[求助]如何获得与50Hz工频同步的窄脉冲信号
  8. 【C#版本详情回顾】C#2.0主要功能列表
  9. Web Components系列(七) ——自定义组件的生命周期
  10. 天津科技大学计算机科学与技术专业怎么样,2021年天津科技大学重点专业排名有哪些,招生优势专业排行榜...