//使用sparkSql完成wordCount
object wordCount_SQL {def main(args: Array[String]): Unit = {//1.创建sparkSessionval spark: SparkSession = SparkSession.builder().appName("wc").master("local[*]").getOrCreate()val sc: SparkContext = spark.sparkContextsc.setLogLevel("WARN")//2.读取文件val df: DataFrame = spark.read.text("E:\\ideal_workspace\\spark\\day01\\words.txt")val ds: Dataset[String] = spark.read.textFile("E:\\ideal_workspace\\spark\\day01\\words.txt")//3.对每一行按照空格切开并压平//df.flatMap(_.split(" ")),df没有泛型,所以不知道_表示String,只能使用dsimport spark.implicits._val wordDS: Dataset[String] = ds.flatMap(_.split(" "))wordDS.show()//ds有泛型,所以编译器知道_表示String//4.注册表wordDS.createOrReplaceTempView("t_word")//5.wordCount查询val sql:String ="""|select value,count(value) as counts|from t_word|group by value|order by counts desc""".stripMarginspark.sql(sql).show()spark.stop()sc.stop()}}

sparkSQL之SQL风格的wordCount相关推荐

  1. SparkSQL之DSL风格的wordcount

    object WordCount_DSL {def main(args: Array[String]): Unit = {//1.创建sparkSessionval spark: SparkSessi ...

  2. 【大数据开发】SparkSQL——RDD、DataFrame、DataSet相互转换、DSL常用方法、SQL风格语法、Spark读写操作、获取Column对象的方式

    take,takeAsList是Action操作 limit⽅法获取指定DataFrame的前n⾏记录,得到⼀个新的DataFrame对象.和take与head不同的是,limit⽅法不是Action ...

  3. Spark SQL概述,DataFrames,创建DataFrames的案例,DataFrame常用操作(DSL风格语法),sql风格语法

    一. Spark SQL 1. Spark SQL概述 1.1. 什么是Spark SQL Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作 ...

  4. 2021年大数据Spark(三十三):SparkSQL分布式SQL引擎

    目录 分布式SQL引擎 Hive的SQL交互方式 ThriftServer JDBC/ODBC Server 开启sparksql的thriftserver 使用beeline 客户端连接 JDBC/ ...

  5. ❤️Spark的关键技术回顾,持续更新!【推荐收藏加关注】❤️

    目录 前言 Spark的关键技术回顾 一.Spark复习题回顾 1.Spark使用的版本 2.Spark几种部署方式? 3.Spark的提交任务的方式? 4.使用Spark-shell的方式也可以交互 ...

  6. 2021年大数据Spark(二十七):SparkSQL案例一花式查询和案例二WordCount

    目录 案例一:花式查询 案例二:WordCount 基于DSL编程 基于SQL编程 具体演示代码如下: 案例一:花式查询 package cn.itcast.sqlimport org.apache. ...

  7. Spark SQL:从入门到精通(一)[SparkSQL初体验]

    入口-SparkSession 在spark2.0版本之前 SQLContext是创建DataFrame和执行SQL的入口 HiveContext通过hive sql语句操作hive表数据,兼容hiv ...

  8. spark sql 上个月_Spark学习之路 (十八)SparkSQL简单使用

    一.SparkSQL的进化之路 1.0以前: Shark 1.1.x开始: SparkSQL(只是测试性的)  SQL 1.3.x: SparkSQL(正式版本)+Dataframe 1.5.x: S ...

  9. PySpark | SparkSQL入门 | DataFrame入门

    文章目录 一.快速入门 1. 什么是SparkSQL 2. 为什么要学习SparkSQL 3. SparkSQL特点 二.SparkSQL概述 1. SparkSQL和Hive的异同 2. Spark ...

最新文章

  1. python【Opencv计算机视觉库】opencv模块cv2常用函数用法(全)
  2. python 根据字典中值的大小对项进行排序
  3. supercharge快充_华为10V 2A充电器曝光,支持20W电荷泵快充
  4. JS 活学活用正则表达式
  5. SAP Spartacus Table cell显示数据类型的Component决定逻辑
  6. Flutter之window系统下配置开发环境以及在Android Studio里面运行hello word
  7. 级差公排php如何_什么是专业级差?专业级差怎么安排专业?
  8. Keras-5 基于 ImageDataGenerator 的 Data Augmentation实现
  9. 4-STM32物联网开发WIFI(ESP8266)+GPRS(Air202)系统方案升级篇(远程升级WIFI内部程序)
  10. 线性代数学习心得(二)矩阵的逆和矩阵变换
  11. 【SpringBoot 】 组件管理 ,java工程师面试突击中华石杉
  12. 疫情时代无接触AI人脸识别技术助力智慧工地迅猛发展
  13. 网站跳出率高是什么原因引起的?如何优化?
  14. ThinkPad L13笔记本怎么U盘重装系统教学
  15. iwifi 技术规范
  16. 电脑网站如何用支付宝收款(php)
  17. 【数据库实验】镶嵌查询
  18. linux iis安装教程,易企秀源码在linux、win主机下的安装教程和详细步骤(含伪静态设置)...
  19. Linux配置通过qq邮件服务器发送邮件
  20. ubuntu18系统支持中文

热门文章

  1. 移动端rem布局实例
  2. buu RSA what 1
  3. 【华为OD】| 密室逃生游戏_逻辑分析
  4. Viper的兄弟Cobra
  5. php throwable,PHP Throwable接口
  6. mysql数据库存储表情都是问号_数据库保存中文全为问号以及emoji表情保存出错...
  7. 爱上你之前,爱对我来说多么遥远:伤感日志
  8. Linux文件系统ugo权限划分详解
  9. 微信属于计算机软件的应用软件吗,微信“卡”谁才说的算? 微信自测程序告诉你...
  10. Qt-QClipboard图片拷贝到微信导致微信很卡的问题