sparkStreaming支持2种操作:

1、转化操作(transformation)会生成一个新的DStream,转换操作分为无状态操作和有状态操作

a)无状态操作:例如map、filter、reduceByKey等都是无状态操作,因为它并没有使用之前批次的数据,操作的是每个时间区域中的数据,不会操作不同时间区域中的数据

b) 有状态操作:基于滑动窗口的转换操作和追踪状态变化的转化操作,有状态转化操作,则会整合不同时间区域内的数据

 

2、输出操作(out operation)会将数据写入到外部系统中(例如saveAStestFile等输出操作,调试的时候使用print操作它会将DStream中的前10个元素打印出来)

 

3、sparkStreaming为读取的数据启动接收器,接收器以任务的形式运行在应用的执行器进程中。(数据保存在执行器进程的内存中,和缓存RDD的方式一样),并且默认把收集到的数据复制到另一个执行器进程中来保障容错性

spark-steaming的2种操作相关推荐

  1. Spark Steaming快速入门

    Spark Steaming Spark Streaming 简介 什么是Spark Streaming Spark Streaming使用Spark Core的快速调度功能来执行流分析.它以小批量方 ...

  2. RDD的两种操作(Transformation和Action)

    RDD创建后就可以在RDD上进行数据处理.RDD支持两种操作:转换(transformation),即从现有的数据集创建一个新的数据集:动作(action),即在数据集上进行计算后,返回一个值给Dri ...

  3. Spark6:Spark Steaming

    Spark Steaming 一.流计算概述 二.Spark Streaming 三.DStream 四.文件流操作 五.套接字流 参考 一.流计算概述 静态数据.流数据 特点 实时处理.主动推送 大 ...

  4. Spark Steaming流式日志过滤与分析

    Spark Steaming流式日志过滤与分析 这篇大概讲的是 spark steaming 监听 hdfs 的某个目录,当你在终端A使用 spark-submit 运行 Log2DB.py 文件后, ...

  5. Spark与Iceberg整合查询操作-查询快照,表历史,data files Manifests 查询快照,时间戳数据...

    1.8.6 Spark与Iceberg整合查询操作 1.8.6.1 DataFrame API加载Iceberg中的数据 Spark操作Iceberg不仅可以使用SQL方式查询Iceberg中的数据, ...

  6. Storm与Spark、Hadoop三种框架对比

    目录 Storm与Spark.Hadoop三种框架对比 一.Storm与Spark.Hadoop三种框架对比 二.hadoop的应用业务分析 二.浅谈Hadoop的基本原理 Hadoop与Storm的 ...

  7. 2021年大数据Spark(九):Spark On Yarn两种模式总结

    目录 Spark On Yarn两种模式 引入 一.当一个MR应用提交运行到Hadoop YARN上时 二.当一个Spark应用提交运行在集群上时 注意 client 模式 cluster 模式 总结 ...

  8. linux 权限 x 表示,在Linux系统中,用户对目录拥有“x”权限,表示可以执行下列哪种操作?...

    在Linux系统中,用户对目录拥有"x"权限,表示可以执行下列哪种操作? 更多相关问题 通过花的中心只能作1个对称面称辐射对称花. 王叔和归纳了脉象( )种,规范了脉象名称. 车轮 ...

  9. WINDOWS SERVER 2003 AD中的5种操作主机

    在之前我们已经了解了在AD(活动目录)中创建林,域树和子域的方法,在一个域中,为了提高容错性和高可用性,我们建议大家在一个域中最好存在多台DC,每个DC维护域中相同的活动目录数据库.而这些DC是对等的 ...

  10. android sharedpre,Android SharedPreferences四种操作模式使用详解_Android_脚本之家

    Android  SharedPreferences详解 获取SharedPreferences的两种方式: 1 调用Context对象的getSharedPreferences()方法 2 调用Ac ...

最新文章

  1. python虚拟环境-conda
  2. mysql数据库配置文件my.ini
  3. 【学习笔记】观察者模式
  4. 【转】ANSI与GB2312的编码问题
  5. NeuCF源码中用到的模块(函数)
  6. Spring 这些能升华代码的技巧,可能会让你爱不释手
  7. 整合Mybatis+Spring | 释疑
  8. react 使用rewired_使用react-app-rewired和customize-cra对默认webpack自定义配置
  9. (转载)《相信自己》
  10. qcom usb驱动下载_艾肯Mobile Q驱动下载
  11. Java入门案例:模拟纸牌游戏拖拉机(升级)
  12. 琪琪格不因为漂亮而自信
  13. python绘制人物关系图_文本分析之制作网络关系图——Python
  14. H5中判断手势滑动方向
  15. echarts在中国地图上绘制各省指标
  16. css3橙色球形_CSS3橙色的星球绕轨道公转动画_html/css_WEB-ITnose -
  17. runshoes369.co.uk,supra s1w uk
  18. 【Linux设置系统时间】
  19. 物联网毕设选题 Stm32家庭有害气体检测系统 - 嵌入式 单片机
  20. 阿里云物联网ACP认证模拟测试题

热门文章

  1. ps安装了可以打开但开始里面找不到_工具篇丨蓝湖切图使用方法—PS
  2. [朝花夕拾][19H2]Win10.0.18363.2158微调-养老专用
  3. python绘图时如何添加图例_【Python】matplotlib 双y轴绘制及合并图例
  4. Go语言入门【java->go】
  5. ppt流程图字体太小_PPT基础不好?这5个高大上的PPT技巧,瞬间让老板刮目相看!...
  6. 管理感悟:加班与忠诚
  7. 08-图9 关键活动 (30 分)
  8. 打开的html文件是字母,HTML文件怎么打开?
  9. 腾讯云服务器与虚拟机搭建主从分离数据库
  10. win+ubuntu双系统grub开机顺序设置