oracle分析函数技术详解(配上开窗函数over())
一、Oracle分析函数入门
分析函数是什么?
分析函数是Oracle专门用于解决复杂报表统计需求的功能强大的函数,它可以在数据中进行分组然后计算基于组的某种统计值,并且每一组的每一行都可以返回一个统计值。
分析函数和聚合函数的不同之处是什么?
普通的聚合函数用group by分组,每个分组返回一个统计值,而分析函数采用partition by分组,并且每组每行都可以返回一个统计值。
分析函数的形式
分析函数带有一个开窗函数over(),包含三个分析子句:分组(partition by), 排序(order by), 窗口(rows) ,他们的使用形式如下:over(partition by xxx order by yyy rows between zzz)。
注:窗口子句在这里我只说rows方式的窗口,range方式和滑动窗口也不提
分析函数例子(在scott用户下模拟)
示例目的:显示各部门员工的工资,并附带显示该部分的最高工资。
--显示各部门员工的工资,并附带显示该部分的最高工资。 SELECT E.DEPTNO,E.EMPNO,E.ENAME,E.SAL,LAST_VALUE(E.SAL) OVER(PARTITION BY E.DEPTNO ORDER BY E.SAL ROWS --unbounded preceding and unbouned following针对当前所有记录的前一条、后一条记录,也就是表中的所有记录--unbounded:不受控制的,无限的--preceding:在...之前--following:在...之后BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) MAX_SALFROM EMP E;
运行结果:
示例目的:按照deptno分组,然后计算每组值的总和
SELECT EMPNO,ENAME,DEPTNO,SAL,SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME) max_salFROM SCOTT.EMP;
运行结果:
示例目的:对各部门进行分组,并附带显示第一行至当前行的汇总
SELECT EMPNO,ENAME,DEPTNO,SAL,--注意ROWS BETWEEN unbounded preceding AND current row 是指第一行至当前行的汇总SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_salFROM SCOTT.EMP;
运行结果:
示例目标:当前行至最后一行的汇总
SELECT EMPNO,ENAME,DEPTNO,SAL,--注意ROWS BETWEEN current row AND unbounded following 指当前行到最后一行的汇总SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING) max_salFROM SCOTT.EMP;
运行结果:
示例目标:当前行的上一行(rownum-1)到当前行的汇总
SELECT EMPNO,ENAME,DEPTNO,SAL,--注意ROWS BETWEEN 1 preceding AND current row 是指当前行的上一行(rownum-1)到当前行的汇总 SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME ROWS BETWEEN 1 PRECEDING AND CURRENT ROW) max_salFROM SCOTT.EMP;
运行结果:
示例目标: 当前行的上一行(rownum-1)到当前行的下辆行(rownum+2)的汇总
SELECT EMPNO,ENAME,DEPTNO,SAL,--注意ROWS BETWEEN 1 preceding AND 1 following 是指当前行的上一行(rownum-1)到当前行的下辆行(rownum+2)的汇总SUM(SAL) OVER(PARTITION BY DEPTNO ORDER BY ENAME ROWS BETWEEN 1 PRECEDING AND 2 FOLLOWING) max_salFROM SCOTT.EMP;
运行结果:
二、理解over()函数
窗口子句在这里我只说rows方式的窗口,range方式和滑动窗口也不提。
当开窗函数over()出现分组(partition by)子句时,
unbounded preceding即第一行是指表中一个分组里的第一行, unbounded following即最后一行是指表中一个分组里的最后一行;
当开窗函数over()省略了分组(partition by)子句时,
unbounded preceding即第一行是指表中的第一行, unbounded following即最后一行是指表中的最后一行。
窗口子句不能单独出现,必须有order by子句时才能出现,
last_value(sal) over(partition by deptno order by sal rows between unbounded preceding and unbounded following)
以上示例指定窗口为整个分组。而出现order by子句的时候,不一定要有窗口子句,但效果会很不一样,此时的窗口默认是当前组的第一行到当前行!
如果省略分组,则把全部记录当成一个组。
a) 如果存在order by则默认窗口是unbounded preceding and current row --当前组的第一行到当前行
b) 如果这时省略order by则窗口默认为unbounded preceding and unbounded following --整个组
而无论是否省略分组子句,如下结论都是成立的:
1、窗口子句不能单独出现,必须有order by子句时才能出现。
2、当省略窗口子句时:
a) 如果存在order by则默认的窗口是unbounded preceding and current row --当前组的第一行到当前行,即在当前组中,第一行到当前行
b) 如果同时省略order by则默认的窗口是unbounded preceding and unbounded following --整个组
所以,
lag(sal) over(order by sal) 解释
over(order by salary)表示意义如下:
首先,我们要知道由于省略分组子句,所以当前组的范围为整个表的数据行,
然后,在当前组(此时为整个表的数据行)这个范围里执行排序(即order by salary),
最后,我们知道分析函数lag(sal)在当前组(此时为整个表的数据行)这个范围里的窗口范围为当前组的第一行到当前行,即分析函数lag(sal)在这个窗口范围执行。
参见:
Oracle的LAG和LEAD分析函数
Oracle分析函数ROW_NUMBER()|RANK()|LAG()使用详解
SELECT DEPTNO, EMPNO, ENAME, SAL, LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO) FROM EMP;
运行结果:
例2:关注点:sql无排序,over()排序子句有,窗口省略
SELECT DEPTNO,EMPNO,ENAME,SAL,LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL DESC)FROM EMP;
运行结果:
例3:关注点:sql无排序,over()排序子句有,窗口也有,窗口特意强调全组数据
SELECT DEPTNO,EMPNO,ENAME,SAL,LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) MAX_SALFROM EMP;
运行结果:
例4:关注点:sql有排序(正序),over()排序子句无,先做sql排序再进行分析函数运算
SELECT DEPTNO,MGR,ENAME,SAL,HIREDATE,LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO) LAST_VALUEFROM EMPWHERE DEPTNO = 30ORDER BY DEPTNO, MGR;
运行结果:
例5:关注点:sql有排序(倒序),over()排序子句无,先做sql排序再进行分析函数运算
SELECT DEPTNO,MGR,ENAME,SAL,HIREDATE,LAST_VALUE(SAL) OVER(PARTITION BY DEPTNO) LAST_VALUEFROM EMPWHERE DEPTNO = 30ORDER BY DEPTNO, MGR DESC;
运行结果:
例6:关注点:sql有排序(倒序),over()排序子句有,窗口子句无,此时的运算是:sql先选数据但是不排序,而后排序子句先排序并进行分析函数处理(窗口默认为第一行到当前行),最后再进行sql排序
SELECT DEPTNO,MGR,ENAME,SAL,HIREDATE,MIN(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL ASC) LAST_VALUEFROM EMPWHERE DEPTNO = 30ORDER BY DEPTNO, MGR DESC;
运行结果:
SELECT DEPTNO,MGR,ENAME,SAL,HIREDATE,MIN(SAL) OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) LAST_VALUEFROM EMPWHERE DEPTNO = 30ORDER BY DEPTNO, MGR DESC;
运行结果:
三、常见分析函数详解
create table t( bill_month varchar2(12) , area_code number, net_type varchar(2), local_fare number );
二、插入数据
insert into t values('200405',5761,'G', 7393344.04); insert into t values('200405',5761,'J', 5667089.85); insert into t values('200405',5762,'G', 6315075.96); insert into t values('200405',5762,'J', 6328716.15); insert into t values('200405',5763,'G', 8861742.59); insert into t values('200405',5763,'J', 7788036.32); insert into t values('200405',5764,'G', 6028670.45); insert into t values('200405',5764,'J', 6459121.49); insert into t values('200405',5765,'G', 13156065.77); insert into t values('200405',5765,'J', 11901671.70); insert into t values('200406',5761,'G', 7614587.96); insert into t values('200406',5761,'J', 5704343.05); insert into t values('200406',5762,'G', 6556992.60); insert into t values('200406',5762,'J', 6238068.05); insert into t values('200406',5763,'G', 9130055.46); insert into t values('200406',5763,'J', 7990460.25); insert into t values('200406',5764,'G', 6387706.01); insert into t values('200406',5764,'J', 6907481.66); insert into t values('200406',5765,'G', 13562968.81); insert into t values('200406',5765,'J', 12495492.50); insert into t values('200407',5761,'G', 7987050.65); insert into t values('200407',5761,'J', 5723215.28); insert into t values('200407',5762,'G', 6833096.68); insert into t values('200407',5762,'J', 6391201.44); insert into t values('200407',5763,'G', 9410815.91); insert into t values('200407',5763,'J', 8076677.41); insert into t values('200407',5764,'G', 6456433.23); insert into t values('200407',5764,'J', 6987660.53); insert into t values('200407',5765,'G', 14000101.20); insert into t values('200407',5765,'J', 12301780.20); insert into t values('200408',5761,'G', 8085170.84); insert into t values('200408',5761,'J', 6050611.37); insert into t values('200408',5762,'G', 6854584.22); insert into t values('200408',5762,'J', 6521884.50); insert into t values('200408',5763,'G', 9468707.65); insert into t values('200408',5763,'J', 8460049.43); insert into t values('200408',5764,'G', 6587559.23); insert into t values('200408',5764,'J', 7342135.86); insert into t values('200408',5765,'G', 14450586.63); insert into t values('200408',5765,'J', 12680052.38); commit;
三、first_value()与last_value():求最值对应的其他属性
问题、取出每月通话费最高和最低的两个地区。
SELECT BILL_MONTH, AREA_CODE,SUM(LOCAL_FARE) LOCAL_FARE, FIRST_VALUE(AREA_CODE) OVER(PARTITION BY BILL_MONTH ORDER BY SUM(LOCAL_FARE) DESC ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) FIRSTVAL, LAST_VALUE(AREA_CODE) OVER(PARTITION BY BILL_MONTH ORDER BY SUM(LOCAL_FARE) DESC ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) LASTVAL FROM T GROUP BY BILL_MONTH, AREA_CODE ORDER BY BILL_MONTH
运行结果:
四、rank(),dense_rank()与row_number():求排序
rank,dense_rank,row_number函数为每条记录产生一个从1开始至n的自然数,n的值可能小于等于记录的总数。这3个函数的唯一区别在于当碰到相同数据时的排名策略。
①row_number:
row_number函数返回一个唯一的值,当碰到相同数据时,排名按照记录集中记录的顺序依次递增。
②dense_rank:
dense_rank函数返回一个唯一的值,当碰到相同数据时,此时所有相同数据的排名都是一样的。
③rank:
rank函数返回一个唯一的值,当碰到相同的数据时,此时所有相同数据的排名是一样的,同时会在最后一条相同记录和下一条不同记录的排名之间空出排名。
演示数据在Oracle自带的scott用户下:
1、rank()值相同时排名相同,其后排名跳跃不连续
SELECT * FROM (SELECT DEPTNO, RANK() OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) RW, ENAME,SALFROM SCOTT.EMP) WHERE RW <= 4;
运行结果:
2、dense_rank()值相同时排名相同,其后排名连续不跳跃
SELECT * FROM (SELECT DEPTNO, DENSE_RANK() OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) RW, ENAME,SALFROM SCOTT.EMP) WHERE RW <= 4;
运行结果:
3、row_number()值相同时排名不相等,其后排名连续不跳跃
SELECT * FROM (SELECT DEPTNO, ROW_NUMBER() OVER(PARTITION BY DEPTNO ORDER BY SAL DESC) RW, ENAME,SALFROM SCOTT.EMP) WHERE RW <= 4;
运行结果:
五、lag()与lead():求之前或之后的第N行
lag和lead函数可以在一次查询中取出同一字段的前n行的数据和后n行的值。这种操作可以使用对相同表的表连接来实现,不过使用lag和lead有更高的效率。
lag(arg1,arg2,arg3)
第一个参数是列名,
第二个参数是偏移的offset,
第三个参数是超出记录窗口时的默认值。
举例如下:
SQL> select * from kkk;
ID NAME
---------- --------------------
1 1name
2 2name
3 3name
4 4name
5 5name
SQL> select id,name,lag(name,1,0) over(order by id) from kkk;
ID NAME LAG(NAME,1,0)OVER(ORDERBYID)
---------- -------------------- ----------------------------
1 1name 0
2 2name 1name
3 3name 2name
4 4name 3name
5 5name 4name
SQL> select id,name,lead(name,1,0) over(order by id) from kkk;
ID NAME LEAD(NAME,1,0)OVER(ORDERBYID)
---------- -------------------- -----------------------------
1 1name 2name
2 2name 3name
3 3name 4name
4 4name 5name
5 5name 0
SQL> select id,name,lead(name,2,0) over(order by id) from kkk;
ID NAME LEAD(NAME,2,0)OVER(ORDERBYID)
---------- -------------------- -----------------------------
1 1name 3name
2 2name 4name
3 3name 5name
4 4name 0
5 5name 0
SQL> select id,name,lead(name,1,'linjiqin') over(order by id) from kkk;
ID NAME LEAD(NAME,1,'ALSDFJLASDJFSAF')
---------- -------------------- ------------------------------
1 1name 2name
2 2name 3name
3 3name 4name
4 4name 5name
5 5name linjiqin
---------------------------------------------------------------------------------------
六、rollup()与cube():排列组合分组
1)、group by rollup(a, b, c):
首先会对(a、b、c)进行group by,
然后再对(a、b)进行group by,
其后再对(a)进行group by,
最后对全表进行汇总操作。
2)、group by cube(a, b, c):
则首先会对(a、b、c)进行group by,
然后依次是(a、b),(a、c),(a),(b、c),(b),(c),
最后对全表进行汇总操作。
1、生成演示数据:
Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.1.0
Connected as ds_trade
SQL> conn system/oracle as sysdba
Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.3.0
Connected as SYS
SQL> create table scott.t as select * from dba_indexes;
Table created
SQL> connect scott/oracle
Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.3.0
Connected as scott
SQL>
2、普通group by体验
sql> select owner, index_type, status, count(*) from t where owner like 'SY%' group by owner, index_type, status;
3、group by rollup(A,B,C)
GROUP BY ROLLUP(A, B, C):
首先会对(A、B、C)进行GROUP BY,
然后再对(A、B)进行GROUP BY,
其后再对(A)进行GROUP BY,
最后对全表进行汇总操作。
sql> select owner, index_type, status, count(*) from t where owner like 'SY%' group by ROLLUP(owner, index_type, status);
4、group by cube(A,B,C)
GROUP BY CUBE(A, B, C):
则首先会对(A、B、C)进行GROUP BY,
然后依次是(A、B),(A、C),(A),(B、C),(B),(C),
最后对全表进行汇总操作。
sql> select owner, index_type, status, count(*) from t where owner like 'SY%' group by cube(owner, index_type, status);
七、max(),min(),sun()与avg():求移动的最值总和与平均值
问题:计算出各个地区连续3个月的通话费用的平均数(移动平均值)
SELECT AREA_CODE, BILL_MONTH,LOCAL_FARE,SUM(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY TO_NUMBER(BILL_MONTH) RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_sum", AVG(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY TO_NUMBER(BILL_MONTH) RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_avg", MAX(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY TO_NUMBER(BILL_MONTH) RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_max", MIN(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY TO_NUMBER(BILL_MONTH) RANGE BETWEEN 1 PRECEDING AND 1 FOLLOWING) "3month_min" FROM (SELECT T.AREA_CODE, T.BILL_MONTH, SUM(T.LOCAL_FARE) LOCAL_FARE FROM T GROUP BY T.AREA_CODE, T.BILL_MONTH)
运行结果:
问题:求各地区按月份累加的通话费
SELECT AREA_CODE, BILL_MONTH,LOCAL_FARE,SUM(LOCAL_FARE) OVER(PARTITION BY AREA_CODE ORDER BY BILL_MONTH ASC) "last_sum_value" FROM (SELECT T.AREA_CODE, T.BILL_MONTH, SUM(T.LOCAL_FARE) LOCAL_FARE FROM T GROUP BY T.AREA_CODE, T.BILL_MONTH) ORDER BY AREA_CODE, BILL_MONTH
运行结果:
--------------------------------------------------------------------------
Blog:http://www.cnblogs.com/linjiqin/
J2EE、Android、Linux、Oracle QQ交流群:142463980、158560018(满)
另见:《Oracle分析函数ROW_NUMBER()|RANK()|LAG()使用详解》
转载于:https://www.cnblogs.com/cjm123/p/8033892.html
oracle分析函数技术详解(配上开窗函数over())相关推荐
- mysql开窗函数over_oracle分析函数技术详解(配上开窗函数over())
一.Oracle分析函数入门 分析函数是什么? 分析函数是Oracle专门用于 解决复杂报表统计需求 的功能强大的函数, 它可以在数据中进行分组然后计算基于组的某种统计 ,并且每一组的每一行都可以返回 ...
- 防火墙虚拟化技术详解(上)
今天继续给大家介绍华为USG6000防火墙.本文主要介绍的是防火墙的虚拟化技术,从虚拟化技术应用和管理两个方面对虚拟化技术进行了详细阐述. 一.虚拟化技术概述 在华为系列防火墙中,存在两种虚拟化技术, ...
- oracle 排序的分析函数,Oracle分析函数用法详解
OVER(PARTITION BY)开窗函数用法 开窗函数,Oracle从8.1.6开始提供开窗函数,开窗函数用于计算基于组的某种聚合值,它和聚合函数的不同之处是: 对于每个组返回多行,而聚合函数对于 ...
- oracle数据库并行数限制,Oracle数据库并行处理技术详解(上)
Oracle数据库并行处理技术是数据库的一项核心技术,它使组织能够高效地管理和访问TB级的数据.如果不能提供高效的Oracle数据库并行处理技术,这些大型数据库(通常用于数据仓库但也越来越多地出现在业 ...
- KILLZONE 2 显示技术详解
转自 KILLZONE 2 显示技术详解[上] KILLZONE 2 显示技术详解[下] 人们开始摸索着如何抛弃现有的 Forward Rendering 而使用其他技术.作为其中一个方法,就是最近开 ...
- 防火墙虚拟化技术详解(下)
今天继续给大家介绍华为USG6000防火墙.本文主要介绍的是防火墙的虚拟化技术,从虚拟系统资源分配.虚拟系统的分流和互访以及虚拟系统与VPN实例三个方面对虚拟化技术进行了详细阐述. 阅读本文前,强烈建 ...
- Oracle 闪回技术详解
概述 闪回技术是Oracle强大数据库备份恢复机制的一部分,在10g的时候就被推出一直延续到现在.在数据库发生逻辑错误的时候,闪回技术能提供快速且最小损失的恢复(多数闪回功能都能在数据库联机状态下完成 ...
- 【H.264/AVC视频编解码技术详解】十九:熵编码算法(5)——H.264的CABAC(上):语法元素的二值化方法...
<H.264/AVC视频编解码技术详解>视频教程已经在"CSDN学院"上线,视频中详述了H.264的背景.标准协议和实现,并通过一个实战工程的形式对H.264的标准进行 ...
- IBM p5服务器上的虚拟 分享,IBMp5服务器系统虚拟技术详解
<IBMp5服务器系统虚拟技术详解>由会员分享,可在线阅读,更多相关<IBMp5服务器系统虚拟技术详解(10页珍藏版)>请在人人文库网上搜索. 1.IBM p5 服务器系统虚拟 ...
- 直播预告丨Oracle数据库网络及存储技术详解-2022云和恩墨大讲堂
文末有惊喜福利哟~ Oracle数据库网络及存储技术详解 点此" 预约 ",即刻报名↓ DBA需要掌握些什么?这是一个老生常谈的话题了.很多时候数据库出了问题,到底是数据库本身的 ...
最新文章
- hdfs/hbase 程序利用Kerberos认证超过ticket_lifetime期限后异常
- Redis与其他缓存框架的对比
- 基于快速排序思想的三个算法题
- 优化UGC流程,获得图文并茂游记so easy
- boost::graph模块实现广度优先搜索算法的使用示例
- 2019 年百度之星·程序设计大赛 - 初赛一
- utils C/C++的常用工具类
- 2007上半年網絡工程師考題
- Could not load JDBC driver class [com.mysql.jdbc.Driver]
- c# 审批流引擎_小熊OA:流程引擎才能真正起到管理价值!
- Javaoop_继承
- 对于String类型的深刻理解
- mAP(mean Average Precision)应用(转)
- 什么是git_什么是Git?
- EclipseLink+H2 快速搭建JPA开发环境
- NBA数据分析及可视化BI数据大屏 (Kobe·Bryant)
- Shiro实战教程笔记
- 一款逼疯妹子的撩妹神器
- Vue项目provide和inject的使用
- 如何为您的PHP应用程序创建Slack接口
热门文章
- 单片机控制步进电机程序c语言正反转停止,单片机控制步进电机正反转程序
- win10无法访问ftp服务器
- 清华大学计算机课程对应教材,清华大学计算机专业大一到四的课程 教材详细名字...
- 计算机房设计规范2008,GB50174-2008 电子计算机机房设计规范
- Citrix 桌面云 XenApp_XenDesktop_7.15 部署系列(二)XenServer7.5安装
- Delphi 2007 TIDHttp HTTPS 出现Error connecting with SSL
- 自动锁定计算机怎么设置,win10如何设置自动锁定屏幕_win10设置自动锁屏的步骤...
- VC11、VC14、VC15库 32位 64位 下载
- wps打开pdf乱码_wps pdf转换成word乱码
- 理解 CMOS IMAGE Sensor