1、题目
编写一个SQL查询,查找学生表中所有重复的学生名。
2、解题思路
1.看到“找重复”的关键字眼,首先要用分组函数(group by),再用聚合函数中的计数函数count()给姓名列计数。
2.分组汇总后,生成了一个如下的表。从这个表里选出计数大于1的姓名,就是重复的姓名。
3、解题步骤
1)、创建一个辅助表,将姓名列进行行分组汇总
select 姓名, count(姓名) as 计数
from 学生表
group by 姓名;
2)选出辅助表中计数大于1的姓名
select 姓名 from 辅助表
where 计数 > 1;
3)结合前两步,将“创建辅助表”的步骤放入子查询
select 姓名 from
(
select 姓名, count(姓名) as 计数
from 学生表
group by 姓名
) as 辅助表
where 计数 > 1;
结果:
这时候有的同学可能会想,为什么要这么麻烦创建一个子查询,不能用这个语句(将count放到where字句中)直接得出答案吗?
select 姓名
from 学生表
group by 姓名
where count(姓名) > 1;
如果我们运行下这个sql语句,会报下面的错误,问题出在哪里呢?
前面提到聚合函数(count),where字句无法与聚合函数一起使用。因为where子句的运行顺序排在第二,运行到where时,表还没有被分组。
如果要对分组查询的结果进行筛选,可以使用having子句。所以,这道题的最优方法如下:
select 姓名
from 学生表
group by 姓名
having count(姓名) > 1;
这里不多介绍这种方法。使用inner join连接自身表,然后根据条件筛选。
select DISTINCT(姓名)
from 学生表 s1
inner join 学生表 s2
on s1.学号!=s2.学号 and s1.姓名=s2.姓名;
4、举一反三
本题也可以拓展为:找出重复出现n次的数据。只需要改变having语句中的条件即可:
select 列名
from 表名
group by 列名
having count(列名) > n;