object WordCount_DSL {def main(args: Array[String]): Unit = {//1.创建sparkSessionval spark: SparkSession = SparkSession.builder().appName("wc").master("local[*]").getOrCreate()val sc: SparkContext = spark.sparkContext//2、读取文件val ds: Dataset[String] = spark.read.textFile("E:\\ideal_workspace\\spark\\day01\\words.txt")//3、对每一行的数据进行切割import spark.implicits._val wordDs: Dataset[String] = ds.flatMap(_.split(" "))//wordDs.show()//4.数据查询wordDs.groupBy("value").count().orderBy($"count".desc).show()spark.stop()sc.stop()}}

SparkSQL之DSL风格的wordcount相关推荐

  1. sparkSQL之SQL风格的wordCount

    //使用sparkSql完成wordCount object wordCount_SQL {def main(args: Array[String]): Unit = {//1.创建sparkSess ...

  2. 定义一个DSL风格的LifecycleObserver(Kotlin)

    package com.xyj.checkupgrade.extendimport androidx.lifecycle.Lifecycle import androidx.lifecycle.Lif ...

  3. Spark SQL概述,DataFrames,创建DataFrames的案例,DataFrame常用操作(DSL风格语法),sql风格语法

    一. Spark SQL 1. Spark SQL概述 1.1. 什么是Spark SQL Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作 ...

  4. 2021年大数据Spark(二十七):SparkSQL案例一花式查询和案例二WordCount

    目录 案例一:花式查询 案例二:WordCount 基于DSL编程 基于SQL编程 具体演示代码如下: 案例一:花式查询 package cn.itcast.sqlimport org.apache. ...

  5. PySpark | SparkSQL入门 | DataFrame入门

    文章目录 一.快速入门 1. 什么是SparkSQL 2. 为什么要学习SparkSQL 3. SparkSQL特点 二.SparkSQL概述 1. SparkSQL和Hive的异同 2. Spark ...

  6. 大数据之SparkSQL简介及DataFrame的使用

    目录 前言: 1.Spark SQL 1.1.Spark SQL概述 1.2.DataFrames 1.3.DataFrame常用操作 总结: 目录 前言: 本文主要介绍下SparkSQL以及Spar ...

  7. Spark之SparkSQL实战

    DataFrames 基本操作和 DSL SQL风格 UDF函数 以及数据源: SparkSQL查询 Json数据准备 123 {"name":"Michael" ...

  8. SparkSql学习笔记(包含IDEA编写的本地代码)

    Spark SQL and DataFrame 1.为什么要用Spark Sql 原来我们使用Hive,是将Hive Sql 转换成Map Reduce 然后提交到集群上去执行,大大简化了编写MapR ...

  9. Spark SQL:从入门到精通(一)[SparkSQL初体验]

    入口-SparkSession 在spark2.0版本之前 SQLContext是创建DataFrame和执行SQL的入口 HiveContext通过hive sql语句操作hive表数据,兼容hiv ...

最新文章

  1. TCP/IP详解--学习笔记(5)-IP选路,动态选路,和一些细节
  2. OpenCV神经网络ANN代码编译运行与解读(二)
  3. Psych101(part5)--Day5
  4. python数据库框架_目前最受欢迎的12个Python开源框架
  5. 呕心沥血干完K-Means聚类——深度AI科普团队
  6. L2-022. 重排链表(双队列)
  7. 我的世界HMCL如何安装Java_Ubuntu 18.04 LTS 使用 Minecraft 我的世界第三方启动器 HMCL...
  8. Python抓取妹子图
  9. cad在哪里设置图幅大小_CAD新建图纸怎么设置视图范围太小?
  10. hex2000使用方法
  11. java中文汉字转英文拼音工具类(无需引用外部pom)
  12. 美术 2.4 UV原理基础
  13. NET Core实战项目之CMS 第九章 设计篇-白话架构设计
  14. Android Kotlin okhttp Retrofit 线程协程那些事
  15. 火焰图片和视频数据集
  16. SSL证书转换:cer转jks,pfx转jks
  17. 你刚才微信上撤回了什么?我都看到了
  18. python爬虫基础06-常见加密算法
  19. MATLAB中freqz函数的用法
  20. spss数据分析(平均值检验、单样本的t检验、两独立样本的t检验、配对样本的t检验)

热门文章

  1. 万字最全Spark内存管理详解
  2. 关于腾讯位置服务的地址解析与路径规划两个api的坑!!!debug了一个晚上终于找出来了
  3. GIS矢量数据的复制粘贴
  4. 计算机主机技术指标,3.计算机系统技术指标及配置.ppt
  5. 【动态规划】基础DP--硬币组合
  6. 回溯法求解连续邮资问题
  7. Dump文件分析整理
  8. 协同管理产品和服务的“下半场”
  9. web开发中上传图片保存base64 好还是保存文件
  10. 电子技术——频率补偿