文章目录

  • 1. 前言
  • 2. 需求与实现
    • 2.1 实现说明
    • 2.2 ROW_NUMBER () 的限制
    • 2.2.1 RANK() 实现
    • 2.2.2 RANK() 的限制
    • 2.2.3 DENSE_RANK() 实现
  • 3. MySQL PostgreSQL 使用自连接实现
  • 4. MySQL 使用 User-Defined Variables 实现开窗函数完成需求
    • 4.1 实现
    • 4.2 进一步学习:官网资料
      • 4.2.1 用户变量作用的时机
      • 4.2.2 可不可以不初始化,就使用
    • 4.3 进一步学习:Spring 相关
  • 5. 后记

1. 前言

项目用了 PostgreSQL 作为数据库。用上了一直感兴趣的开窗函数,这里记录以下。
考虑到使用MySQL的项目也可能有这种需求,思考 MySQL 8.0 以前的实现方式(8.0开始就有开窗函数了,不用自己造轮子)。探索的过程中,把 User-Defined Variables 也学起来了,结合官网资料做一下笔记。

2. 需求与实现

  • 需求
    主表要关联历史表,取历史表最新的一条数据,根据最新时间关联上的历史表中的数据要全部带出来
  • PostgreSQL 实现:
SELECT*
FROMmain main
LEFT JOIN (SELECT* FROM( SELECT *, ROW_NUMBER () OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history ) TEMP WHERE TEMP.rw = 1
) history ON main.main_id = history.main_id;
  • 拆解sql
SELECT*
FROMmain main
LEFT JOIN (SELECT* FROM( 【这一部分是本文讨论的重点, 拆出来放到下文】) TEMP WHERE TEMP.rw = 1
) history ON main.main_id = history.main_id;

后文讨论 ROW_NUMBER () 、RANK()、DENSE_RANK 关注以下sql即可

SELECT *, ROW_NUMBER () OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history

2.1 实现说明

  • OVER ( PARTITION BY main_id ORDER BY create_time DESC )
    数据根据 main_id 分组 (与group by 不同,这里多条数据不会被合并成一条),组内的数据按 create_time 倒序排列

  • ROW_NUMBER ()
    根据 OVER 的排序规则,为数据编号,如果 create_time 相同,依旧会保证 1,2,3…n 的连续序号

2.2 ROW_NUMBER () 的限制

SELECT *, ROW_NUMBER () OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history


使用 ROW_NUMBER () 实现需求,默认了以下行为:
一个主表有多个历史表,但是历史表同一时刻(尽管create_time相同),只会取一条记录。
如果主表希望查出两个历史表记录,需要用到 rank()

2.2.1 RANK() 实现

SELECT *, rank() OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history

2.2.2 RANK() 的限制

可以看到上文main_id = 1 的分组中 rw 列的排列是 1, 1, 3。
如果需要1 , 1, 2 这种稠密的编码,则需要使用到dense_rank

2.2.3 DENSE_RANK() 实现

SELECT *, dense_rank() OVER ( PARTITION BY main_id ORDER BY create_time DESC ) AS rw FROM main_history

3. MySQL PostgreSQL 使用自连接实现

MAX(create_time) 就是最近时间

SELECT*
FROMmain mainLEFT JOIN (SELECThistoryTemp.* FROMmain_history historyTempJOIN ( SELECT  main_id, MAX(create_time) AS max_create_time FROM main_history GROUP BY main_id ) TEMP ON historyTemp.main_id = TEMP.main_id AND historyTemp.create_time = TEMP.max_create_time ) history ON main.main_id = history.main_id;

4. MySQL 使用 User-Defined Variables 实现开窗函数完成需求

这一部分是结合网上的资料,用mysql能解析的方式实现了开窗函数。一开始看这些变量真的挺头晕的,后面查阅官方资料,也算是清晰了。

4.1 实现

  • ROW_NUMBER()
SELECThistory.*, IF( @pre_main_id = history.main_id, @cur_rank := @cur_rank + 1, @cur_rank := 1 ) row_number , @pre_main_id := history.main_id
FROM-- 连接可能被线程池工具复用,避免变量污染, 每次使用都重新初始化 变量main_history history  ,( SELECT @cur_rank := 0, @pre_main_id := NULL ) r
ORDER BYhistory.main_id, history.create_time DESC
  • DENSE_RANK()
SELECT history.*,
IF(@pre_main_id = history.main_id, IF(@pre_create_time = history.create_time, @cur_rank, @cur_rank := @cur_rank + 1), @cur_rank := 1) dense_rank,
-- 后置处理
@pre_create_time := history.create_time temp2, @pre_main_id := history.main_id temp3
FROM -- 连接可能被线程池工具复用,避免变量污染, 每次使用都重新初始化 变量main_history history, (SELECT @cur_rank := 0, @pre_main_id := NULL, @pre_create_time := NULL, @rank_counter := 1) r
ORDER BY history.main_id, history.create_time DESC
) temp where dense_rank = 1;
  • RANK()
SELECT history.*,
-- 前置处理, 保证总数递增,确保形如 1, 1, 3 这种排列,而不是 1, 1, 2
IF(@pre_main_id = history.main_id, @rank_counter := @rank_counter + 1, @rank_counter := 1) temp1,
IF(@pre_main_id = history.main_id, IF(@pre_create_time = history.create_time, @cur_rank, @cur_rank := @rank_counter), @cur_rank := 1) rank,
-- 后置处理
@pre_create_time := history.create_time temp2, @pre_main_id := history.main_id temp3
FROM -- 连接可能被线程池工具复用,避免变量污染, 每次使用都重新初始化 变量main_history history, (SELECT @cur_rank := 0, @pre_main_id := NULL, @pre_create_time := NULL, @rank_counter := 1) r
ORDER BY history.main_id, history.create_time DESC

4.2 进一步学习:官网资料

User-Defined Variables 官方文档
【前置知识】一个sql语句的执行过程:存储引擎 -> server -> client

4.2.1 用户变量作用的时机

In a SELECT statement, each select expression is evaluated only when sent to the client. This means that in a HAVING, GROUP BY, or ORDER BY clause, referring to a variable that is assigned a value in the select expression list does not work as expected: SELECT (@aa:=id) AS a, (@aa+3) AS b FROM tbl_name HAVING b=5;

释意: 用户变量作用在select语句上,只有在发送到客户端的时候才会被解析.
言下之意是:以下语句执行时,用户变量还没处理数据,所以不要使用用户变量。

  • HAVING
  • GROUP BY
  • ORDER BY

4.2.2 可不可以不初始化,就使用

If you refer to a variable that has not been initialized, it has a value of NULL and a type of string.

释意:未初始化使用,默认值为string 类型的 null

4.3 进一步学习:Spring 相关

使用了用户变量,很自然就要在意变量是不是线程安全的。类似Spring 集成线程池,连接是共享的,要特别在意线程安全问题。
对于这个问题,有网友解答了:参考连接 (内容是搬运stackoverflow的)

Including (select @num := 0) initializes the variable at the beginning of the query. User-defined variables are scoped to the individual connection, and a connection can only run one query at a time, so this specific case is perfectly “thread-safe.”
However, it’s also a bit of a hack.

select
@num := (@num + 1) as row_number
from
user u,
(select @num := 0);

简要释义:一个connection同一时刻只会允许一个语句执行。(select @num := 0) 声明了一个connection作用域的用户变量。如果connection是隔离的,用户变量这个时候是安全的。

补充:

(select @num := 0)

Spring 会复用 connection,但是使用用户变量时都重新初始化,也不用担心connenction的上个使用者传递一个使用过的用户变量给下一个使用者。

5. 后记

最近 chatGPT好火,可以想象 chatGPT 以后能把开窗函数的 sql 转化成 MySQL 5.x 的对等实现。希望国内早点引进这种提高生产力的技术。

【PostgreSQL】使用开窗函数获取历史表最新记录 及 MySQL 旧版本实现相关推荐

  1. Hibernate 获取某个表全部记录时 奇怪现象 (重复出现某个记录)

    我用Hibernate连接access的mdb 列出某个表全部记录的时候,发现有一个记录重复了.而直接用jdbc连接,就可以正确列出来. 本来还以为mdb不稳定,还吓了我一跳.毕竟打算用它作为长久数据 ...

  2. mysql查询一个数据库所有表的记录数,mysql 查看数据库中所有表的记录数

    mysql使用select count(*) from table_name可以查询某个表的总记录数.想快速的知道数据库中所有表的记录数信息怎么办?如果使用mysql的版本在5.0及以上,可以通过查询 ...

  3. Excel-利用函数获取工作表标签名称(转)

    方法一 常规方法 cell函数 也可以这样取得工作表名,在任一单元格输入: =RIGHT(CELL("filename"),LEN(CELL("filename" ...

  4. Hive 中的wordCount、Hive 开窗函数

    Hive 中的wordCount.Hive 开窗函数 目录 Hive 中的wordCount.Hive 开窗函数 Hive 中的wordCount Hive 开窗函数 测试数据 建表语句 1.row_ ...

  5. MS SQLSERVER中如何快速获取表的记录总数

    (转自:http://www.cnblogs.com/pingkeke/archive/2006/05/29/411995.html) 在数据库应用的设计中,我们往往会需要获取某些表的记录总数,用于判 ...

  6. php对接小鹅通API开发高级实战案例解析:获取指定资源学习记录信息(单人单学习记录、单人多学习记录累计、返回数据格式确认)

    获取指定资源学习记录信息 前言 一.获取指定资源学习记录信息请求方式及url 二.获取指定资源学习记录信息请求参数 请求参数 请求格式 三.单人单学习记录API封装函数 四.单人多学习记录API封装函 ...

  7. 5最后一条记录_在一堆数据中,如何获取最后一次记录?

    获取最后一次记录在工作中经常出现 查最后一次采购价,查最后一次销售记录,在工作中经常需要用到,手工操作可以办到,以下图为例: 日期升序排列的采购清单 如果我想查询猪肉最后一次的采购价,首先要对表格进行 ...

  8. PostGreSQL开窗函数

    PostGreSQL开窗函数 语法 <窗口函数> over(partition by 分组列 order by 排序列) order by 并非必要 over() 是开窗函数的关键词 窗口 ...

  9. Windows x64平台 获取PEB表,并获取kernel32.dll的基址,并获取它的函数

    参考了:https://www.cnblogs.com/aliflycoris/p/5185097.html 和另一位博主 话不多说,进入正题: 首先是获取PEB基址,先得懂怎么在64位平台嵌入汇编代 ...

最新文章

  1. 快讯 | 第三届数据标准化及治理优秀评选顺利结束
  2. 团队编程项目作业5-小组评分
  3. 谁是谷歌想要的人才:智商高不见得总是好员工
  4. 【audio】耳机插拔 线控按键识别流程【转】
  5. (转)Unity3d使用心得(2):Unity3d 动态下载动画资源——AnimationClip 的使用
  6. 安卓交换位置动画_好马配好鞍,OriginOS系统让安卓系统大变样
  7. Rust: r# 原生标识操作符
  8. 圆周率计算程序图计算机基础知识,项目七 用计算机计算圆周率——设计简单数值数据算法...
  9. c语言汉字utf8,C语言汉字gbk转utf-8
  10. python学习第二天——编写名片
  11. java获取域名的mx记录,A记录、CNAME、MX记录、NS记录
  12. java适合音频格式_我应该为java使用什么音频格式?
  13. 【从零开始学深度学习编译器】十四,MLIR Toy Tutorials学习笔记之部分Lowering
  14. mysql 保留小数位数
  15. 深度学习卷积神经网络重要结构之通道注意力和空间注意力模块
  16. Can't connect to MySQL server on 'localhost'(10038)的解决方案
  17. 基于Linux下 Oracle 备份策略(RMAN)---转自沙弥的世界
  18. 使用TIM3和TIM4,驱动外接LED和STM32上已焊接的LED,实现2个 LED呼吸灯的效果
  19. Before Anything, an Architect Is a Developer
  20. 随机漫步问题(醉汉行走)

热门文章

  1. Netscreen 防火墙透明模式配置案例
  2. mapreduce程序如何跳过待处理文件的首行
  3. osgEarth的Rex引擎原理分析(九十五)地形变形(Terrain morphing)
  4. OpenCV(三)——图像分割
  5. 物联网平台的产品架构
  6. 微信小程序多规格选择
  7. C语言字母转十进制,c语言十进制转换_C语言 字符串转换成十进制整数
  8. 易优cms安装环境要求
  9. 小程序和App同时拥有?两者兼得的一种技术方案
  10. (9)3DMAX之复制功能(复制属性、变换复制、阵列工具、间隔工具)