Spark Streaming代码:

package streamingimport org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}object HDFSWordCount {def main(args: Array[String]): Unit = {//    if (args.length < 1 ){//      System.err.println("Usage: HdfsWordCount <directory>")
//      System.exit(1)
//    }val sparkConf = new SparkConf().setAppName("HdfsWordCount")//.setMaster("local[2]")// create the contextval scc = new StreamingContext(sparkConf,Seconds(2))val lines = scc.socketTextStream("master",9999)val words = lines.flatMap(_.split(" "))val wordCounts = words.map((_,1)).reduceByKey(_+_)wordCounts.print()wordCounts.saveAsObjectFiles(args(0))scc.start()scc.awaitTermination()}
}

利用maven打包:

mvn clean assembly:assembly

上传到集群后
创建脚本 run_hdfs20.sh :

cd $SPARK_HOME
./bin/spark-submit \--class streaming.HDFSWordCount \--master yarn-cluster \--files $HIVE_HOME/conf/hive-site.xml \/usr/local/src/badou_code/streaming/badou_spark_20_test-1.0-SNAPSHOT-jar-with-dependencies.jar \hdfs://master:9000/output/log

运行脚本 sh -x run_hdfs20.sh

启动端口命令:nc -lp 9999 随便输出数字字母
结果:

-------------------------------------------
Time: 1612670866000 ms
-------------------------------------------
(,1)
(a,4)-------------------------------------------
Time: 1612670868000 ms
-------------------------------------------
(aa,1)
(a,4)

hdfs中查询:hadoop fs -ls /output/

drwxr-xr-x   - root supergroup          0 2021-02-06 19:58 /output/log-1612670296000
drwxr-xr-x   - root supergroup          0 2021-02-06 19:58 /output/log-1612670298000
drwxr-xr-x   - root supergroup          0 2021-02-06 19:58 /output/log-1612670300000
drwxr-xr-x   - root supergroup          0 2021-02-06 19:58 /output/log-1612670302000
drwxr-xr-x   - root supergroup          0 2021-02-06 19:58 /output/log-1612670304000

Spark Streaming保存到HDFS目录中案例相关推荐

  1. Spark 把RDD数据保存到hdfs单个文件中,而不是目录

    相比于Hadoop,Spark在数据的处理方面更加灵活方便.然而在最近的使用中遇到了一点小麻烦:Spark保存文件的的函数(如saveAsTextFile)在保存数据时都需要新建一个目录,然后在这个目 ...

  2. Crawler:基于BeautifulSoup库+requests库+伪装浏览器的方式实现爬取14年所有的福彩网页的福彩3D相关信息,并将其保存到Excel表格中

    Crawler:Python爬取14年所有的福彩信息,利用requests库和BeautifulSoup模块来抓取中彩网页福彩3D相关的信息,并将其保存到Excel表格中 目录 输出结果 核心代码 输 ...

  3. Word: 是否将更改保存到WordCmds.dot中?

    是否将更改保存到WordCmds.dot中? 1.问题描述 关闭Word会弹出"是否将更改保存到WordCmds.dot中?"提示,无论是点保存,还是不保存,下次关闭Word的时候 ...

  4. R语言使用pdf函数将可视化图像结果保存到pdf文件中、使用pdf函数打开图像设备、使用dev.off函数关闭图像设备、自定义width参数和height参数指定图像的宽度和高度

    R语言使用pdf函数将可视化图像结果保存到pdf文件中.使用pdf函数打开图像设备.使用dev.off函数关闭图像设备.自定义width参数和height参数指定图像的宽度和高度 目录

  5. java 格式化json_JAVA 格式化JSON数据并保存到json文件中的实例

    使用fastjson格式化json数据并保存到文件 /** * 将JSON数据格式化并保存到文件中 * @param jsonData 需要输出的json数 * @param filePath 输出的 ...

  6. R语言使用pdf函数将可视化图像结果保存到pdf文件中、使用pdf函数打开图像设备、使用dev.off函数关闭图像设备、自定义paper参数指定pdf的纸张类型(多使用A4)

    R语言使用pdf函数将可视化图像结果保存到pdf文件中.使用pdf函数打开图像设备.使用dev.off函数关闭图像设备.自定义paper参数指定pdf的纸张类型(多使用A4) 目录

  7. Pandas的学习(读取mongodb数据库集合到DataFrame,将DataFrame类型数据保存到mongodb数据库中)

    1.读取mongodb数据库集合到DataFrame import pymongo import pandas as pdclient = pymongo.MongoClient("数据库连 ...

  8. C++读取txt数据为二维数组 将数据保存到txt文本中

      C++读取txt数据为二维数组 保存txt文本数据     C++文件读写操作有:ofstream,ifstream,fstream: #include <fstream> ofstr ...

  9. session mysql java_PHP自定义session处理方法,保存到MySQL数据库中

    我们都知道,session是为了解决因特网的无状态属性而创造出来的.我们可以用session这种会话管理机制来构建购物车.监控站点网络访问,甚至还可以跟踪某一个用户具体是如何使用你的应用的.PHP默认 ...

最新文章

  1. php5.5.33 源码安装,Linux PHP5.3升级PHP5.5.33
  2. 华为mate20 android,华为Mate20 Pro上手:安卓最强机会带来哪些体验惊喜?
  3. 【TensorFlow】TensorFlow从浅入深系列之三 -- 教你如何对MNIST手写识别
  4. Hadoop源码分析21:namenode概要
  5. c语言编程车,C语言编程之自动类型转化
  6. XML Schema --simpleType
  7. 美团搜索推荐多业务商品排序探索与实践
  8. 01 分布式系统架构的冰与火
  9. 使用原配的SSD安装和引导DSM5.2 5644 基于zmouse和Formater教程
  10. 智方8000系文具进销存管理系统 华军软件网
  11. 耿建超英语语法---非谓语动词作主语
  12. deamon(大鹅模拟器steam)
  13. 技校计算机应用基础,技校《计算机应用基础》教法探讨
  14. 4k纸是几厘米乘几厘米_4k纸多大,纸张的大小规格
  15. 成都中忻嘉业:抖音小店商品不出单,如何做好优化
  16. Tool:Visio2016/Visio2019专业版64位中文下载、安装(图文教程)之详细攻略
  17. 传奇手游开服教程:怎么开传奇手游?开传奇手游需要准备什么?
  18. 风哥MySQL数据库视频培训教程大合集(网盘下载.共10套)
  19. 傅里叶变换关于函数向量的解释
  20. 缉拿隐藏进程以及隐藏CPU利用率的进程

热门文章

  1. 字符串拼接之+=和join()的比较
  2. CentOS 7第一次使用时的基础配置
  3. 得知发行组长老潘今天岗位上最后一天就要离开有感
  4. java.util报错
  5. Saltstack远程执行命令(3)
  6. 201703-2-学生排队
  7. preact源码学习(3)
  8. wordpress发送测试邮件
  9. 今天小小的总结一下最近的小程序中的问题
  10. (原创)sqlite封装库SmartDB1.3发布