有个需求 统计每天的类型和占比

绑定渠道 绑定人数 统计日期 占比

占比是每天的每个渠道数/每天的总数

首先查出来渠道,人数,日期 hql是

select case bind_type
    when 1 then '二维码绑定'
    when 2 then '邀请码绑定'
    when 3 then '领取优惠券绑定'
    when 4 then '分享链接绑定'
  end bindtype,substring(bind_date,0,10) countday,count(bind_type) counttype from ods_app_goods_mb_info where length(bind_date)>0 group by substring(bind_date,0,10),bind_type

占比就是 比如 23号, 23的二维码绑定数/23的总数  14/14+25+40=14/79

这里用窗口函数之后的hql是

select a.bindtype,a.countday,a.counttype,sum(a.counttype) over(partition by a.countday)  from (
select case bind_type
    when 1 then '二维码绑定'
    when 2 then '邀请码绑定'
    when 3 then '领取优惠券绑定'
    when 4 then '分享链接绑定'
  end bindtype,substring(bind_date,0,10) countday,count(bind_type) counttype from ods_app_goods_mb_info where length(bind_date)>0 group by substring(bind_date,0,10),bind_type) a order by substring(countday,0,10)

这样就可以把查出来的结果可以再进行一次汇总统计了。

上面红色的意思的     根据统计日期分区求counttype的和作为窗口列

大数据 hive 记录 窗口函数 求占比相关推荐

  1. 2021年大数据Hive(七):Hive的开窗函数

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的开窗函数 一.窗口函数 ROW_NUMBER,RANK ...

  2. 2021年大数据Hive(四):Hive查询语法

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 hive查询语法 一.SELECT语句 1.语句结构 2.全表查 ...

  3. 2021年大数据Hive(三):手把手教你如何吃透Hive数据库和表操作(学会秒变数仓大佬)

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive数据库和表操作 一.数据库操作 1.创建数据库 2.创建 ...

  4. 2021年大数据Hive(十二):Hive综合案例!!!

    全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive综合案例 一.需求描述 二.项目表的字段 三.进 ...

  5. 2021年大数据Hive(十一):Hive调优

    全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive调优 一.本地模式 1.空key处理 二.SQL ...

  6. 2021年大数据Hive(九):Hive的数据压缩

    全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive的数据压缩 一.MR支持的压缩编码 二.压缩配置 ...

  7. 2021年大数据Hive(八):Hive自定义函数

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive自定义函数 一.概述 1.UDF(User-Define ...

  8. 2021年大数据Hive(五):Hive的内置函数(数学、字符串、日期、条件、转换、行转列)

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的内置函数 一.数学函数 1. 取整函数: round ...

  9. 2021年大数据Hive(二):Hive的三种安装模式和MySQL搭配使用

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的三种安装模式和MySQL搭配使用 一.Hive的安装方 ...

最新文章

  1. 2月07日云栖精选夜读:观点 | 阿里云 MVP 唐俊飞:安全性可以认为是一种能力...
  2. teechart属性和方法
  3. Day 10: PhoneGap —— 开发手机应用如此简单
  4. 报表查询——自动刷新数据,双击明细打开关联作业
  5. js定位div坐标存入mysql_JavaScript与Div 对层定位和移动获得坐标
  6. 网管必须了解的理光复印机相关故障现相之一
  7. Linux C文件编译
  8. 【未解决】Flink : Error notifying leader istener about new leader The RPC connection is already closed
  9. Windows 电脑命令一览
  10. reactive streams的Mono及Flux
  11. C 标准库 —— limits.h
  12. 监督学习的分类:判别/生成模型,概率/非概率模型、参数/非参数模型
  13. R 语言之数据分析高级方法「主成分分析」和「因子分析」
  14. Linux vim字符串替换
  15. 为什么 BI 软件都搞不定关联分析?带你分析分析
  16. Photoshop快速抠图:使用蒙版工具
  17. 使用Supermemo背单词6周年了
  18. 在Android Studio如何制作聊天气泡
  19. 计算机组成原理 累加器实验
  20. 高清壁纸wallhaven.cc下载图片

热门文章

  1. 佳兆业上市11年,旧改之王的核心竞争力在哪里?
  2. 详解floyd算法 及<MATLAB>实现
  3. 女孩的第一声老公意味这什么!
  4. 杭州 编程培训python 暑假
  5. java后台实现生成二维码并且上传的详细介绍
  6. php语言好学习吗,带你学习世界上最好的语言PHP(七)
  7. 计算机网络概念梳理 第一章
  8. 无法保存在html是表格里,excel表格不能保存数据库中-为什么数据库中的表不能修改保存...
  9. 9款日志采集和管理工具对比,选型必备!
  10. [代码详解]使用Python3+tkinter开发带图形化界面的班级考勤系统