正式开始之前,我们先来看下 MySQL 服务器的配置和版本号信息,如下图所示

 

 “兵马未动粮草先行”,看完了相关的配置之后,我们先来创建一张测试表和一些测试数据。

-- 如果存在 person 表先删除
DROP TABLE IF EXISTS person; 

-- 创建 person 表,其中 username 字段可为空,并为其设置普通索引
CREATE TABLE person (
 id INT PRIMARY KEY auto_increment,
 name VARCHAR(20),
 mobile VARCHAR(13),
 index(name)
) ENGINE=\'innodb\';

-- person 表添加测试数据
insert into person(name,mobile) values(\'Java\',\'13333333330\'),
 (\'MySQL\',\'13333333331\'),
 (\'Redis\',\'13333333332\'),
 (\'Kafka\',\'13333333333\'),
 (\'Spring\',\'13333333334\'),
 (\'MyBatis\',\'13333333335\'),
 (\'RabbitMQ\',\'13333333336\'),
 (\'Golang\',\'13333333337\'),
 (NULL,\'13333333338\'),
 (NULL,\'13333333339\');
  
select * from person;

构建的测试数据,如下图所示:

 

 有了数据之后,我们就来看当列中存在 NULL 值时,究竟会导致哪些问题?

1.count 数据丢失

当某列存在 NULL 值时,再使用 count 查询该列,就会出现数据“丢失”问题,如下 SQL 所示:

select count(*),count(name) from person;

查询执行结果如下:

解决方案

如果某列存在 NULL 值时,就是用 count(*) 进行数据统计。

扩展知识:不要使用 count(常量)

阿里巴巴《Java开发手册》强制规定:不要使用 count(列名) 或 count(常量) 来替代 count(),count() 是 SQL92 定义的标准统计行数的语法,跟数据库无关,跟 NULL 和非 NULL 无关。

说明:count(*) 会统计值为 NULL 的行,而 count(列名) 不会统计此列为 NULL 值的行。

2.distinct 数据丢失

当使用 count(distinct col1, col2) 查询时,如果其中一列为 NULL,那么即使另一列有不同的值,那么查询的结果也会将数据丢失,如下 SQL 所示:

select count(distinct name,mobile) from person;

查询执行结果如下:

 

 数据库的原始数据如下:

 

 从上述结果可以看出手机号一列的 10 条数据都是不同的,但查询的结果却为 8。

3.select 数据丢失

如果某列存在 NULL 值时,如果执行非等于查询(<>/!=)会导致为 NULL 值的结果丢失。比如以下这个数据:

 

 我需要查询除 name 等于“Java”以外的所有数据,预期返回的结果是 id 从 2 到 10 的数据,但当执行以下查询时:

select * from person where name<>\'Java\' order by id;
--
select * from person where name!=\'Java\' order by id;

查询结果均为以下内容:

 

 可以看出为 NULL 的两条数据凭空消失了,这个结果并不符合我们的正常预期。

解决方案

要解决以上的问题,只需要在查询结果中拼加上为 NULL 值的结果即可,执行 SQL 如下:

select * from person where name<>\'Java\' or isnull(name) order by id;

最终的执行结果如下:

 

版权声明:本文为tracydzf原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/tracydzf/p/14323632.html