这也是这几天突发奇想写的一个专题,正好自己的数据库方面比较欠缺,希望通过这个系列能多学点数据库知识,当然,这些场景都是工作中遇到或者某次突然的灵感想到。该系列有以下几个特点:
- 更新不定期,通常有灵感了会记在印象笔记上,然后研究整理成文;
- 研究的数据库为MySQL;
- 侧重场景和SQL语句的书写优化。
场景描述:
假设现在有两个数据表,表1为产品表product,表2为产品图片表product_pic。两表通过product_id相连,关系为一对多的,即每个产品可能有多张图片,当然,也可能没有图片。
那么问题来了:
现在要查询product产品,并且要按照有无图片来排序,即有图片的放后面,没有图片的放前面,怎么做比较好?
建两个测试表:
方案1:子查询
虽然不推荐子查询,但这毕竟是一种解决问题的有效方法。
select p.product_id,p.name from product as p order by (select count(pp.product_id) from product_pic as pp where p.product_id = pp.product_id) asc
结果如下
方案2:left join
先简单的将两个表左联起来并排序:
select p.product_id,p.name,pp.pic from product as p left join product_pic as pp on p.product_id = pp.product_id order by pp.pic asc
简单地将两个表左联起来得到如下结果:
这样如果product_pic中有多条数据对应就会在结果集中重复出现。
有了这样的结果,那么就很简单了,将其去重就ok了,首先想到group by
select p.product_id,p.name,pp.pic from product as p left join product_pic as pp on p.product_id = pp.product_id group by p.product_id order by pp.pic asc
结果如下:
问题似乎解决了,但是有个两个隐性问题
- group by 合并不能按照你的意愿来做,比如这条“男装”对应的图片是“1.jpg”,实际上它有“1.jpg”和“2.jpg”,如果想要的是“2.jpg”怎么办?
- 如果要按照产品图片数量来排序怎么办?
紧接着又想到了另一个去重的方法distinct
select distinct p.product_id,p.name from product as p left join product_pic as pp on p.product_id = pp.product_id order by pp.pic asc
结果如下:
效果与group by差不多
最后还想测试一下性能,是不是跟想象的一样
于是写个脚本往数据库插入1万条数据,分别测试上述三条SQL语句:
- 子查询运行时间:50.89s
- group by查询运行时间:1min 23.55s
- distinct查询运行时间:39.98 s
暂时我只能做简单的分析,以后再分析一下group by 和distinct的区别~
第一期先这样,算是热身~~