object Spark13_RDD_Operator_Transform {def main(args: Array[String]): Unit = {val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")val sc = new SparkContext(sparkConf)// TODO 算子 - 双Value类型// 交集,并集和差集要求两个数据源数据类型保持一致// 拉链操作两个数据源的类型可以不一致val rdd1 = sc.makeRDD(List(1,2,3,4))val rdd2 = sc.makeRDD(List(3,4,5,6))val rdd7 = sc.makeRDD(List("3","4","5","6"))// 交集 : 【3,4】val rdd3: RDD[Int] = rdd1.intersection(rdd2)//val rdd8 = rdd1.intersection(rdd7)println(rdd3.collect().mkString(","))// 并集 : 【1,2,3,4,3,4,5,6】val rdd4: RDD[Int] = rdd1.union(rdd2)println(rdd4.collect().mkString(","))// 差集 : 【1,2】val rdd5: RDD[Int] = rdd1.subtract(rdd2)println(rdd5.collect().mkString(","))// 拉链 : 【1-3,2-4,3-5,4-6】val rdd6: RDD[(Int, Int)] = rdd1.zip(rdd2)val rdd8 = rdd1.zip(rdd7)println(rdd6.collect().mkString(","))sc.stop()}
}

TODO算子-双Value类型相关推荐

  1. TODO算子-双Value类型的操作

    object Spark12_RDD_Operator_Transform1 {def main(args: Array[String]): Unit = {val sparkConf = new S ...

  2. B/S、C/S双客户类型系统研究

    根据javaEE平台,我们可以知道,JavaEE的架构类型有2种.B/S架构和C/S架构. 一.体系结构 客户层          服务器层        业务层               EIS信 ...

  3. Spark的RDD转换算子

    目录 RDD转换算子 Value 类型 1. map 2. mapPartitions map 和mapPartitions 的区别 3. mapPartitionsWithIndex 4. flat ...

  4. 第三课 大数据技术之Spark-RDD介绍和转换算子

    第三课 大数据技术之Spark-RDD介绍和转换算子 文章目录 第三课 大数据技术之Spark-RDD介绍和转换算子 第一节 RDD相关介绍 1.1 什么是 RDD 1.2 核心属性 1.3 执行原理 ...

  5. 尚硅谷大数据技术Spark教程-笔记02【SparkCore(核心编程,map、mapPartitions、mapPartitionsWithIndex、flatMap、glom、groupBy)】

    视频地址:尚硅谷大数据Spark教程从入门到精通_哔哩哔哩_bilibili 尚硅谷大数据技术Spark教程-笔记01[Spark(概述.快速上手.运行环境.运行架构)] 尚硅谷大数据技术Spark教 ...

  6. spark之交集并集差集拉链

    spark之交集并集差集拉链 def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setMaster(&qu ...

  7. SparkCore入门编程

    一.Spark的概述 1.1 Hadoop的回顾 版本号的发展 hadoop1.x : hdfs 和 mapreduce hadoop2.x : hdfs.mapreduce.yarn.common ...

  8. spark算子详细介绍(v、k-v、vv类型)

    spark算子详细介绍 算子分区数.分区器如何确定? Value 类型 1. map() 改变结构就用map 2. mapPartitions() 以分区为单位执行Map 思考一个问题:map和map ...

  9. Spark转换算子大全以及案例实操

    1.RDD 转换算子 RDD转换算子实际上就是换了名称的RDD方法 RDD 根据数据处理方式的不同将算子整体上分为 Value 类型.双 Value 类型和 Key-Value 类型 算子:Opera ...

最新文章

  1. 16岁应该遵循什么_16岁就被张艺谋选中,刘浩存到底有什么来头?
  2. 在页面中控制媒体流的起播点和播放长度
  3. 还觉得linux命令难吗,看这篇2w多字的linux命令详解,通俗易懂
  4. 0118互联网新闻 | 抖音成央视春晚独家社交媒体传播平台;石墨任务清单小程序上线...
  5. java中的equals()空对象的出错
  6. 三星第二财季净利69亿美元 同比增50%
  7. dsp 数据类型强制转换_JavaSE第二章总结—数据类型
  8. (转)python调取C/C++的dll生成方法
  9. mysql数据存储过程详解_mysql数据存储过程参数实例详解
  10. leetcode 42 python
  11. python修改pdf文件大小,python读pdf文件字体大小_用Python读取pdf文件
  12. java串口发送十六进制数,本文实例为大家分享了Java实现串口通信的具体代码,供大家参考,具体内容如下1.介绍使用Java实现的串口通信程序,支持十六进制数据的发送与接收。 源码:...
  13. Hadoop 2.6.0 HA高可用集群配置详解
  14. PicGo+Github图床配置
  15. onenote怎么同步到电脑_如何同步手机和电脑 onenote
  16. 【实验分享】通过Console口登录到Cisco设备
  17. grant之后要跟着flush privileges吗?
  18. 一个人的时候,学会坦然。
  19. 关闭阿里云的短信提醒
  20. ElasticSearch 中的中文分词器以及索引基本操作详解

热门文章

  1. SpringCloud SpringBoot mybatis分布式微服务云架构开发Web应用
  2. 【追光者系列】Hikari连接池大小多大合适?(第一弹)
  3. 亚信安全中标南方电网网络架构优化调整项目 智能联动抑制未知威胁
  4. 前人栽树,后人擦屁股
  5. 【李宏毅2020 ML/DL】P53-55 Conditional Generation by RNN Attention Pointer Network Recursive
  6. 【广度优先搜索】一个实例+两张动图彻底理解 BFS | 思路+代码详解 | 用 DFS 自动控制我们的小游戏
  7. Visual Studio DSL 入门 13---结合T4生成代码
  8. hbase1.1.1 连接集群_hbase1.2.3集群搭建
  9. hbase分页查询实现
  10. 如何通过jQuery动态设置元素CSS的样式,以及HTML中CSS “内联式”、“嵌套式”、“外联式”使用方法