题目:

(1)

var sql ="""|select shop_name,count(distinct user_id)|from t_shop|group by shop_name|""".stripMargin

(2)

  /*var sql ="""|select shop_name,user_id,count(*)|from t_shop|group by shop_name,user_id|//as ct|""".stripMargin*///2).查询每个店铺被用户访问的次数排名  表t2
/*    var sql ="""|select shop_name,user_id,|rank() over(partition by shop_name order by ct) rk|from t1|as t2|""".stripMargin*///3).取得每个店铺的前三名/*  var sql ="""|select shop_name,user_id,ct|from t2|where rk<=3|""".stripMargin
*///4).整合var sql ="""|select shop_name,user_id,ct|from(|     select shop_name,user_id,ct,rank() over(partition by shop_name order by ct) rk|     from|     (|       select shop_name,user_id,count(*) ct|       from t_shop|       group by shop_name,user_id|     )t1| )t2|where rk<=3|""".stripMarginval result: DataFrame = spark.sql(sql)result.show()

完整作业代码

object ShopApplication {def main(args: Array[String]): Unit = {/*1.创建*/val spark: SparkSession = SparkSession.builder().config("spark.app.name", "Shop").config("spark.master", "local[*]").getOrCreate()/*2.导入数据*/val rdd: RDD[String] = spark.sparkContext.textFile("hdfs://hadoop10:9000/jd_visit.log")/*读取数据,获取df对象*/import spark.implicits._val df1: DataFrame = rdd.map(_.split("\\s+")).map(array => (array(0), array(1))).toDF("user_id", "shop_name")df1.createTempView("t_shop")//需求1:每个店铺的UV(访客数)/*  var sql ="""|select shop_name,count(distinct user_id)|from t_shop|group by shop_name|""".stripMargin*///需求2:每个店铺访问次数top3的访客信息。输出店铺名称、访客id、访问次数//1).查询每个店铺被访问的次数 表ct/*var sql ="""|select shop_name,user_id,count(*)|from t_shop|group by shop_name,user_id|//as ct|""".stripMargin*///2).查询每个店铺被用户访问的次数排名  表t2
/*    var sql ="""|select shop_name,user_id,|rank() over(partition by shop_name order by ct) rk|from t1|as t2|""".stripMargin*///3).取得每个店铺的前三名/*  var sql ="""|select shop_name,user_id,ct|from t2|where rk<=3|""".stripMargin
*///4).整合var sql ="""|select shop_name,user_id,ct|from(|     select shop_name,user_id,ct,rank() over(partition by shop_name order by ct) rk|     from|     (|       select shop_name,user_id,count(*) ct|       from t_shop|       group by shop_name,user_id|     )t1| )t2|where rk<=3|""".stripMarginval result: DataFrame = spark.sql(sql)result.show()//释放资源spark.stop()}
}

作业题:京东店铺访问数相关推荐

  1. 求每个店铺访问次数top3的访客信息

    题目: 有50W个京东店铺,每个顾客访客访问任何一个店铺的任何一个商品时都会产生一条访问日志, 访问日志存储的表名为Visit,访客的用户id为user_id,被访问的店铺名称为shop,数据如下: ...

  2. 京东店铺的所有商品API接口-(item_search_shop-获得店铺的所有商品接口),京东API接口

    一.京东店铺的所有商品API接口-(item_search_shop-获得店铺的所有商品接口),京东API接口代码如下: 1.公共参数 名称 类型 必须 描述 key String 是 调用key(必 ...

  3. 弘辽科技:京东店铺运营方法

    今天给大家分享的是京东店铺运营的方法,从多角度去帮大家分析,避免走弯路.我们都知道做店铺的根源就是既要有流量又要有转化,所以具备了这两点店铺才能达到你想要的效果. 那么我们在京东平台上,不管是做什么类 ...

  4. Sql面试题-求店铺访问top3信息

    题目: 有个网店,每个顾客访客访问任何一个店铺的任何一个商品时都会产生一条访问日志,访问日志存储的表名为Visit,访客的用户id为uid,被访问的店铺名称为shop,请统计: 1)每个店铺的UV(访 ...

  5. 京东店铺的所有商品API接口(item_search_shop-获得店铺的所有商品API接口),整店商品API接口

    可以通过京东店铺的所有商品API接口采集店铺所有商品详情页各项数据,包含商品标题,SKU信息.价格.优惠价,收藏数.销量.SKU图.标题.详情页图片等页面上有的数据均可以拿到,大家都知道,京东的反爬虫 ...

  6. 通过seller_nick:店铺昵称获取京东店铺所有商品接口,京东店铺所有商品API接口,API接口返回参数接入方案

    一.京东店铺所有商品接口参数说明: 1.通过seller_nick:店铺昵称获取京东店铺所有商品接口,可以获取获得店铺的所有商品,宝贝ID, 商品详情页,商品标题,宝贝图片, 价格, 优惠价,销量,商 ...

  7. php 固定人数拼手气_独立统计在线人数和访问数代码分享(php)

    代码有2张,和一个sql 1.conn_count.php < ?php $host="localhost"; //请在双引号内填写你的mysql数据库主机 $root=&q ...

  8. 访问数,每次访问页数,平均停留时间,跳出率

    访问数,同一个 IP ,离开后再上一次,按 2 次算. 综合浏览量,所有页面点击访问总数. 每次访问页数,每次登陆网站平均点击的页面数( PV ). 网站平均停留时间,每次访问网站到离开经历的时间平均 ...

  9. 京东店铺托管引流技巧有哪些?

    其实不管是京东店铺还是淘宝.天猫店铺,开展起来的首要工作就是推广引流,只有将这些做好才能让店铺长期运营下去,但是大部分卖家对于这部分的工作不是特别了解,下面小编就来为大家讲解一下推广引流技巧有哪些? ...

最新文章

  1. 解读:为什么要做特征归一化/标准化?
  2. MPB:亚热带生态所葛体达组-原位酶谱法高分辨率实时检测土壤微界面酶活分布...
  3. 怎么用vc采集ni卡数据_SystemLink自学笔记(6):SystemLink架构和数据服务
  4. 从 2015 年起的未来五年内有哪些创业方向 | PMcaff-产品
  5. 你应该知道的 Node 基础知识
  6. 拼多多出手了,iPhone 12系列最高降价800元!
  7. OSChina 周日乱弹 —— 感到孤单了怎么办?
  8. 学习记录1——vissim4.3安装和vissim4.3时间修改工具使用
  9. 多质点列车动力学模型
  10. 锂电池管理系统(BMS)-市场现状及未来发展趋势
  11. 溢出的文字如何省略号显示
  12. c语言流控制(20180710)
  13. 公民身份证号码的编排规则
  14. S5PV210-uboot解析(三)-start_armboot解析
  15. vscode中嵌入cppcheck进行静态检查,包含插件使用方法
  16. 2022-08-17 工作记录--Git-贮藏 和 弹出贮藏
  17. 微信小程序-----图书馆座位预约(一)
  18. U盘怎样传输大于4G的文件?
  19. 伯努利方程示例 Python 计算(汽水流体和喷泉工程)
  20. yolov5创新 C3GN:引荐HorNet递归门控卷积GnConv重构目标检测颈部网络

热门文章

  1. 发布Jar到中央仓库报错 Remote staging failed: Staging rules failure!
  2. 打造完美可随意安装的WinXP镜像
  3. 打磨Comodo,做有意义的事儿(1)
  4. vue实现浮动广告(浏览器范围内匀速移动)
  5. WIN7下ADS使用详解
  6. 软工第一次团队作业 - 采访!
  7. 【暮色天】乱世疯狂 盛世安逸(7.8)
  8. 哈工大计算机学院2020复试分数线,2020考研分数线:哈尔滨工业大学2020年复试基本分数线公布!...
  9. 51单片机——直流电机调速
  10. 1.1.5 在同一折线图中画2条曲线