大数据 hive 记录 窗口函数 求占比
有个需求 统计每天的类型和占比
绑定渠道 | 绑定人数 | 统计日期 | 占比 |
占比是每天的每个渠道数/每天的总数
首先查出来渠道,人数,日期 hql是
select case bind_type
when 1 then '二维码绑定'
when 2 then '邀请码绑定'
when 3 then '领取优惠券绑定'
when 4 then '分享链接绑定'
end bindtype,substring(bind_date,0,10) countday,count(bind_type) counttype from ods_app_goods_mb_info where length(bind_date)>0 group by substring(bind_date,0,10),bind_type
占比就是 比如 23号, 23的二维码绑定数/23的总数 14/14+25+40=14/79
这里用窗口函数之后的hql是
select a.bindtype,a.countday,a.counttype,sum(a.counttype) over(partition by a.countday) from (
select case bind_type
when 1 then '二维码绑定'
when 2 then '邀请码绑定'
when 3 then '领取优惠券绑定'
when 4 then '分享链接绑定'
end bindtype,substring(bind_date,0,10) countday,count(bind_type) counttype from ods_app_goods_mb_info where length(bind_date)>0 group by substring(bind_date,0,10),bind_type) a order by substring(countday,0,10)
这样就可以把查出来的结果可以再进行一次汇总统计了。
上面红色的意思的 根据统计日期分区求counttype的和作为窗口列
大数据 hive 记录 窗口函数 求占比相关推荐
- 2021年大数据Hive(七):Hive的开窗函数
全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的开窗函数 一.窗口函数 ROW_NUMBER,RANK ...
- 2021年大数据Hive(四):Hive查询语法
全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 hive查询语法 一.SELECT语句 1.语句结构 2.全表查 ...
- 2021年大数据Hive(三):手把手教你如何吃透Hive数据库和表操作(学会秒变数仓大佬)
全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive数据库和表操作 一.数据库操作 1.创建数据库 2.创建 ...
- 2021年大数据Hive(十二):Hive综合案例!!!
全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive综合案例 一.需求描述 二.项目表的字段 三.进 ...
- 2021年大数据Hive(十一):Hive调优
全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive调优 一.本地模式 1.空key处理 二.SQL ...
- 2021年大数据Hive(九):Hive的数据压缩
全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive的数据压缩 一.MR支持的压缩编码 二.压缩配置 ...
- 2021年大数据Hive(八):Hive自定义函数
全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive自定义函数 一.概述 1.UDF(User-Define ...
- 2021年大数据Hive(五):Hive的内置函数(数学、字符串、日期、条件、转换、行转列)
全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的内置函数 一.数学函数 1. 取整函数: round ...
- 2021年大数据Hive(二):Hive的三种安装模式和MySQL搭配使用
全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的三种安装模式和MySQL搭配使用 一.Hive的安装方 ...
最新文章
- 2月07日云栖精选夜读:观点 | 阿里云 MVP 唐俊飞:安全性可以认为是一种能力...
- teechart属性和方法
- Day 10: PhoneGap —— 开发手机应用如此简单
- 报表查询——自动刷新数据,双击明细打开关联作业
- js定位div坐标存入mysql_JavaScript与Div 对层定位和移动获得坐标
- 网管必须了解的理光复印机相关故障现相之一
- Linux C文件编译
- 【未解决】Flink : Error notifying leader istener about new leader The RPC connection is already closed
- Windows 电脑命令一览
- reactive streams的Mono及Flux
- C 标准库 —— limits.h
- 监督学习的分类:判别/生成模型,概率/非概率模型、参数/非参数模型
- R 语言之数据分析高级方法「主成分分析」和「因子分析」
- Linux vim字符串替换
- 为什么 BI 软件都搞不定关联分析?带你分析分析
- Photoshop快速抠图:使用蒙版工具
- 使用Supermemo背单词6周年了
- 在Android Studio如何制作聊天气泡
- 计算机组成原理 累加器实验
- 高清壁纸wallhaven.cc下载图片
热门文章
- 佳兆业上市11年,旧改之王的核心竞争力在哪里?
- 详解floyd算法 及<MATLAB>实现
- 女孩的第一声老公意味这什么!
- 杭州 编程培训python 暑假
- java后台实现生成二维码并且上传的详细介绍
- php语言好学习吗,带你学习世界上最好的语言PHP(七)
- 计算机网络概念梳理 第一章
- 无法保存在html是表格里,excel表格不能保存数据库中-为什么数据库中的表不能修改保存...
- 9款日志采集和管理工具对比,选型必备!
- [代码详解]使用Python3+tkinter开发带图形化界面的班级考勤系统