一、基本查询
-- 创建数据库、数据表
-- 创建数据库
create database python_test_1 charset=utf8;
-- 使用数据库
use python_test_1;
-- students表
create table students(
id int unsigned primary key auto_increment not null,
name varchar(20) default '',
age tinyint unsigned default 0,
height decimal(5,2),
gender enum('男','女','中性','保密') default '保密',
cls_id int unsigned default 0,
is_delete bit default 0
);
-- classes表
create table classes (
id int unsigned auto_increment primary key not null,
name varchar(30) not null
);
准备数据
-- 向students表中插入数据
insert into students values
(0,'小明',18,180.00,2,1,0),
(0,'小月月',18,180.00,2,2,1),
(0,'彭于晏',29,185.00,1,1,0),
(0,'刘德华',59,175.00,1,2,1),
(0,'黄蓉',38,160.00,2,1,0),
(0,'凤姐',28,150.00,4,2,1),
(0,'王祖贤',18,172.00,2,1,1),
(0,'周杰伦',36,NULL,1,1,0),
(0,'程坤',27,181.00,1,2,0),
(0,'刘亦菲',25,166.00,2,2,0),
(0,'金星',33,162.00,3,3,1),
(0,'静香',12,180.00,2,4,0),
(0,'郭靖',12,170.00,1,4,0),
(0,'周杰',34,176.00,2,5,0);
-- 向classes表中插入数据
insert into classes values (0, "python_01期"), (0, "python_02期");
-- 查询所有字段
select * from 表名;
例:
select * from students;
-- 查询指定字段
select 列1,列2,... from 表名;
例:
select name from students;
-- 使用 as 给字段起别名
select id as 序号, name as 名字, gender as 性别 from students;
-- 如果是单表查询 可以省略表名
select id, name, gender from students;
-- 表名.字段名
select students.id,students.name,students.gender from students;
-- 可以通过 as 给表起别名
select s.id,s.name,s.gender from students as s;
-- 消除重复行
在select后面列前使用distinct可以消除重复的行
select distinct 列1,... from 表名;
例:
select distinct gender from students;
二、条件查询
- 条件:
使用where子句对表中的数据筛选,结果为true的行会出现在结果集中. - 语法如下:
select * from 表名 where 条件;
例:
select * from students where id=1; - where后面支持多种运算符,进行条件的处理
- 比较运算符:=, >, >=, <, <=, !=(<>)
查询编号大于3的学生
select * from students where id > 3;
- 逻辑运算符:and, or, not
查询编号大于3的女同学
select * from students where id > 3 and gender='女';
- 模糊查询:like
-- %表示任意多个任意字符
-- _表示一个任意字符
查询姓黄的学生
select * from students where name like '黄%';
- 范围查询
-- in表示在一个非连续的范围内
查询编号是1或3或8的学生
select * from students where id in(1,3,8);
-- between ... and ...表示在一个连续的范围内
例11:查询编号为3至8的学生
select * from students where id between 3 and 8;
- 空判断
-- 注意:null与''是不同的
-- 判空is null
查询没有填写身高的学生
select * from students where height is null;
-- 判非空is not null
查询填写身高的学生
select * from students where height is not null;
- 优先级
-- 优先级由高到低的顺序为:小括号,not,比较运算符,逻辑运算符
-- and比or先运算,如果同时出现并希望先算or,需要结合()使用
三、排序
为了方便查看数据,可以对数据进行排序
- 语法:
select * from 表名 order by 列1 asc|desc [,列2 asc|desc,...] - 说明
将行数据按照列1进行排序,如果某些行列1的值相同时,则按照列2排序,以此类推,默认按照列值从小到大排列(asc),asc从小到大排列,即升序,desc从大到小排序,即降序。
查询未删除男生信息,按学号降序
select * from students where gender=1 and is_delete=0 order by id desc;
四、聚合函数
为了快速得到统计数据,经常会用到如下5个聚合函数:
1. 总数
count(*)表示计算总行数,括号中写星与列名,结果是相同的
例1:查询学生总数
select count(*) from students;
2. 最大值
max(列)表示求此列的最大值
例2:查询女生的编号最大值
select max(id) from students where gender=2;
3. 最小值
min(列)表示求此列的最小值
例3:查询未删除的学生最小编号
select min(id) from students where is_delete=0;
4. 求和
sum(列)表示求此列的和
例4:查询男生的总年龄
select sum(age) from students where gender=1;
5. 平均值
avg(列)表示求此列的平均值
例5:查询未删除女生的编号平均值
select avg(id) from students where is_delete=0 and gender=2;
五、分组
- group by
- group by的含义:将查询结果按照1个或多个字段进行分组,字段值相同的为一组
- group by可用于单个字段分组,也可用于多个字段分组
select gender from students group by gender;
+--------+
| gender |
+--------+
| 男 |
| 女 |
| 中性 |
| 保密 |
+--------+
- group by + group_concat()
group_concat(字段名)可以作为一个输出字段来使用,
表示分组之后,根据分组结果,使用group_concat()来放置每一组的某字段的值的集合
select gender,group_concat(id) from students group by gender;
+--------+------------------+
| gender | group_concat(id) |
+--------+------------------+
| 男 | 3,4,8,9,14 |
| 女 | 1,2,5,7,10,12,13 |
| 中性 | 11 |
| 保密 | 6 |
+--------+------------------+
- group by + 集合函数
分别统计性别为男/女的人的个数
select gender,count(*) from students group by gender;
+--------+----------+
| gender | count(*) |
+--------+----------+
| 男 | 5 |
| 女 | 7 |
| 中性 | 1 |
| 保密 | 1 |
+--------+----------+
- group by + having
having 条件表达式:用来分组查询后指定一些条件来输出查询结果
having作用和where一样,但having只能用于group by
select gender,count(*) from students group by gender having count(*)>2;
+--------+----------+
| gender | count(*) |
+--------+----------+
| 男 | 5 |
| 女 | 7 |
+--------+----------+
- group by + with rollup
with rollup的作用是:在最后新增一行,来记录当前列里所有记录的总和
select gender,count(*) from students group by gender with rollup;
+--------+----------+
| gender | count(*) |
+--------+----------+
| 男 | 5 |
| 女 | 7 |
| 中性 | 1 |
| 保密 | 1 |
| NULL | 14 |
+--------+----------+
六、分页
获取部分行
当数据量过大时,在一页中查看数据是一件非常麻烦的事情语法
select * from 表名 limit start,count
说明
从start开始,获取count条数据
例1:查询前3行男生信息
select * from students where gender=1 limit 0,3;
七、连接查询
当查询结果的列来源于多张表时,需要将多张表连接成一个大的数据集,再选择合适的列返回
mysql支持三种类型的连接查询,分别为:
- 内连接查询:查询的结果为两个表匹配到的数据
- 右连接查询:查询的结果为两个表匹配到的数据,右表特有的数据,对于左表中不存在的数据使用null填充
- 左连接查询:查询的结果为两个表匹配到的数据,左表特有的数据,对于右表中不存在的数据使用null填充
- 语法:
select * from 表1 inner或left或right join 表2 on 表1.列 = 表2.列
使用内连接查询班级表与学生表
select * from students as s inner join classes as c on s.cls_id = c.id;
使用左连接查询班级表与学生表
select * from students as s left join classes as c on s.cls_id = c.id;
使用右连接查询班级表与学生表
select * from students as s right join classes as c on s.cls_id = c.id;
八、自关联
现在有这样一个需求:请设计表示省市信息的表?
我们来分析下,省有id和name,市有id、name和市所属的省pid,我们可以设计2张表分别表示省、市表,但是我们可以发现两张表都有id和name,而市表只比省表多了一个字段pid,所以我们考虑设计一张表areas,结构如下:
id
atitle
pid
- 说明:
- 因为省没有所属的省份,所以可以填写为null。
- 城市所属的省份pid,填写省所对应的编号id。
这就是自关联,表中的某一列,关联了这个表中的另外一列,但是它们的业务逻辑含义是不一样的,城市信息的pid引用的是省信息的id,在这个表中,结构不变,可以添加区县、乡镇街道、村社区等信息。
创建areas表的语句如下:
create table areas(
aid int primary key,
atitle varchar(20),
pid int
);
从sql文件中导入数据
source areas.sql;
查询:
查询一共有多少个省
select count(*) from areas where pid is null;
查询省的名称为“山西省”的所有城市
select city.* from areas as city
inner join areas as province on city.pid=province.aid
where province.atitle='山西省';
查询市的名称为“广州市”的所有区县
select dis.* from areas as dis
inner join areas as city on city.aid=dis.pid
where city.atitle='广州市';
九、子查询
在一个 select 语句中,嵌入了另外一个 select 语句, 那么被嵌入的 select 语句称之为子查询语句。
- 主查询和子查询的关系
- 子查询是嵌入到主查询中
- 子查询是辅助主查询的,要么充当条件,要么充当数据源
- 子查询是可以独立存在的语句,是一条完整的 select 语句
- 子查询分类
- 标量子查询: 子查询返回的结果是一个数据(一行一列)
- 列子查询: 返回的结果是一列(一列多行)
- 行子查询: 返回的结果是一行(一行多列)
--标量子查询
--查询班级大于平均年龄的学生
select * from students where age > (select avg(age) from students);
--列子查询
--查询还有学生在班的班级名字
select name from classes where id in (select cls_id from students);
--行子查询
--查询年龄最大,身高最高的学生信息
select * from students where (age,height) = (select max(age),max(height) from students);
十、总结:
- 查询的完整格式:
SELECT select_expr [,select_expr,...] [
FROM tb_name
[WHERE 条件判断]
[GROUP BY {col_name | postion} [ASC | DESC], ...]
[HAVING WHERE 条件判断]
[ORDER BY {col_name|expr|postion} [ASC | DESC], ...]
[ LIMIT {[offset,]rowcount | row_count OFFSET offset}]
]
- 完整的select语句
select distinct *
from 表名
where ....
group by ... having ...
order by ...
limit start,count
- 执行顺序
from 表名
where ....
group by ...
select distinct *
having ...
order by ...
limit start,count