[Mysql] 聚集函数:NULL是否包含在内(包括count(1)和count(*)的比较)
本篇博客主要整理并亲自验证一下count(*), count(1)和count(column-name)的区别,本部的内容主要参考stackoverflow,除此之外,对聚集函数中是否包含NULL值进行了验证。
本文所有测试数据基于macOS10.14.3,mysql5.7.25。
一、数据
本文主要使用2张数据表,分别是user和product表,其中,user表的“name”和“product_id”字段是varchar类型,“id”和“record”是int类型;product表的“id”是varchar类型,“price”是double类型。两个表都没有设置主键和外键。
其数据如下:
①user表
name | id | record | product_id |
---|---|---|---|
A | 1 | 10 | id1 |
A | 2 | 5 | id2 |
A | 3 | 1 | id2 |
B | 6 | NULL | id4 |
B | NULL | 1 | id3 |
NULL | 4 | NULL | id3 |
NULL | 5 | 2 | NULL |
NULL | NULL | NULL | NULL |
②product表
id | price |
---|---|
id1 | 25.00 |
id2 | 75.00 |
id3 | 100.00 |
注意:上表中的NULL不是字符串NULL,而是表示mysql中的填充符NULL。
二、sql语句
1、count(column-name)
count(column-name): 统计column-name所在列non-NULL的记录数;重复的非NULL元素多次计数。
count(distince(column-name)): 统计column-name所在列non-NULL的记录,且去重,也就是重复的non-NULL元素只计数一次。
下面是关于二者的例子:
SELECT COUNT(name) FROM user # 输出为5,只计算non-NULL值
SELECT COUNT(DISTINCT(name)) FROM user # 输出为2,DISTINCT(name)包含NULL值,但是count()之后就不再包括
2、count(*) vs count(1)
count(*): 统计所有数据的行数(含有NULL的也计算在内)
count(1): 功能和count(*)一样,输出结果也一样,性能也没差别。
①举例1:
SELECT COUNT(*) FROM user # 输出为8,包含null值,某一个字段为null或者所有字段都为null的行都包括在内
SELECT COUNT(1) FROM user # 输出为8,包含null值,某一个字段为null或者所有字段都为null的行都包括在内
②举例2:
SELECT product.id, COUNT(*)
FROM user
LEFT JOIN product ON user.product_id=product.id
GROUP BY product.id
将count(*)换成count(1)的结果也是一样的,其结果(二者结果一样):
执行计划(二者结果一样)如下:
注:在30w的数据量上使用count(*)和count(1),发现时间性能也是一样的。当count(*)和count(1)选择时,一般选择使用count(*),mysql官方语句也给出的count(*)[官方文档:counting-rows]。
3、其他聚集函数
在别人的博客上看到一句话:所有聚集函数中,除了COUNT(*)计算NULL值之外,其他的都是自动只将non-NULL值计算在内。这里举些例子验证一下这个问题。
SELECT SUM(record) FROM user #输出为19,只计算non-NULL的值
SELECT COUNT(record) FROM user #输出为5,只计算non-NULL的数目
SELECT AVG(record) FROM user #输出为3.8,只计算non-NULL的数目
SELECT COUNT(DISTINCT(record)) FROM user # 输出为4,DINTINCT(record)是包含null的,但是COUNT()之后就不包括null了
SELECT MAX(record) FROM user # 输出为10
SELECT MIN(record) FROM user # 输出为1,所以只计算包含non-NULL的值,NULL是不默认为0的
4、其他
另外,这里顺便说明一下FORMAT()和ROUND()的区别:
SELECT FORMAT(1234.4476566555,5) # 输出为1,234.44766,四舍五入,返回类型是字符串,所以会自动加逗号
SELECT ROUND(1234.4476566555,5) # 输出为1234.44766,四舍五入,FORMAT和ROUND功能一样,都是四舍五入,但是FORMAT会自动加逗号,而ROUND不会
SELECT ROUND(now(), '%Y %m %d %h') # 返回当前时间
三、总结
- 验证了聚集函数关于NULL值的处理:除了count(*)之外的其他聚集函数(包括count(column-name), sum(), avg(), max(), min())都只操作non-NULL的值。
- count(1)和count(*)在mysql中没有区别,无论是结果还是性能都是相同的。(在其他数据库中是否一致不确定)
参考文章:
[1] count() vs count(column-name) - which is more correct? [duplicate]
[2] COUNT() vs. COUNT(1) vs. COUNT(pk): which is better? [duplicate]
[Mysql] 聚集函数:NULL是否包含在内(包括count(1)和count(*)的比较)相关推荐
- mysql 聚集函数 count 使用详解
mysql 聚集函数 count 使用详解 本文将探讨以下问题 1.count(*) . count(n).count(null)与count(fieldName) 2.distinct 与 coun ...
- mysql 聚集函数与group by,聚集函数可以和where一起用吗 聚合函数如何与group by函数一起使用...
SQL中where语句能用聚合函数吗?聚合函数应该用在having子句中. 聚合函数如果想用在where中的话,应该只能用子查询来实现(在子查询中进行聚合函数计算,然后在主查询中进行where判断). ...
- mysql 聚集函数 比较_mysql-汇总(聚集)函数
我们需要汇总数据而不用把他们实际检索出来,他们主要用来进行分析和报表数据的生成. 1.AVG:通过对表中行数计数并计算特定列值之和,求得该列的平均值.可用来返回所有列的平均值,也可以用来返回特定列或行 ...
- mysql 聚集函数 count 使用详解(转载)
本文将探讨以下问题 1.count(*) . count(n).count(null)与count(fieldName) 2.distinct 与 count 连用 3.group by (多个字段) ...
- Oracle Spacial(空间数据库)空间聚集函数
定义 空间聚集函数作用于包含若干几何对象的查询结果,返回单个SDO_GEOMETRY对象 示例:返回查询结果的最小包围盒 selectSDO_AGGR_MBR(shape) from ...
- mysql中判断字段是否包含数字或者是否为纯数字
文章目录 各种场景 判断字段是否包含数字 使用like模糊查询包含某个数字 使用mysql原生函数FIND_IN_SET查询包含某个数字 使用regexp正则匹配纯数字 使用regexp正则匹配字段值 ...
- MySQL 学习笔记(3)— 字符串函数、数值函数、日期时间函数、流程函数、聚集函数以及分组数据
1. 字符串函数 MySQL 的常用函数包括字符串函数.数值函数.日期时间函数.流程函数等. SELECT ascii("abc"),char(97),concat("h ...
- mysql min函数 结果全为null_MySQL ----- 聚集函数(AVG,SUM,COUNT,MIN,MAX) (十一)
为了汇总数据而不把实际的检索出来,MySQL 提供了专门的函数,聚集函数 好处:可以将检索数据进行分析和报表生成 一.聚集函数(aggregate function): 运行在行组上,计算和返回单个值 ...
- Mysql| Mysql函数,聚集函数的介绍与使用(Lower,Date,Mod,AVG,...)
转载自https://blog.csdn.net/u011479200/article/details/78633382 关于MYSQL的函数 函数没有通用的SQL语句的可移植性强 能运行在多个系统上 ...
最新文章
- flaming pear flood中文版
- 理解 Linux 网络栈(2):非虚拟化Linux 环境中的 Segmentation Offloading 技术
- 机票预定系统类图_电商系统延时任务机制源码分享
- 九、PyQt5 QLineEdit输入的子网字符串校验QRegExp
- [渝粤教育] 西南科技大学 建筑工程质量缺陷事故分析及处理 在线考试复习资料
- Dijkstra + 堆优化
- 数据库查询三个以上名字重复的数据
- 坚持写博客,以身说法——我与CSDN的1234
- 明翰英语教学系列之雅思写作篇V0.2(持续更新)
- EDK2编译环境搭建、编译、在模拟器运行、在笔记本运行(带目录版本)
- oracle招聘ocp认证,OracleOCP认证要通过哪些考试?
- Python有趣小程序,轻松向靓仔打招呼~
- Kubernets 亲和性
- i++是线程安全的吗
- python pandas dropna 删除空值/缺失值(DataFrame)
- Java 变量作用域、构造方法官方教程
- 苹果拍照怎么显示地点和时间_内部秘密中医体质辨识与调理师证报名时间怎么报考考试地点...
- 自然语言处理学习笔记-lecture09-篇章分析
- msn服务器系统,msn不能登录
- 模仿搜索框搜索提示案例笔记分享
热门文章
- oracle select any dictionary oracle授权详解
- apache服务器如何实现301重定向
- java.security.NoSuchAlgorithmException: No such algorithm: RSA/ECB/PKCS1Padding 问题解决
- 泰坦陨落2服务器维护,《泰坦陨落》服务器受攻击数月未修复 评价跌至差评如潮...
- C# 双色球核心代码
- manjaro 安装aur
- Matlab中用于数据预测spline()函数的使用
- slurm作业提交系统常用命令
- iOS开发之数据库WCDB
- 贪吃的大嘴 多重背包 dp