- 窗口函数简介
- 数据准备
- 问题描述
- 解答
窗口函数简介
窗口函数是 SQL 中一类特别的函数。
- 和聚合函数相似,窗口函数的输入也是多行记录
- 不同的是,聚合函数对其所作用的每一组记录输出一条结果,而窗口函数对其所作用的窗口中的每一行记录输出一条结果
- OVER 子句定义查询结果集内的窗口。 然后,开窗函数(sum、max、min、avg、count、rank等)将计算窗口中每一行的值,以便取得各种聚合值,例如 移动平均值、累积聚合、运行总计、每组结果的前 N 个结果
窗口函数定义
开窗函数 OVER (
[ <PARTITION BY clause> ]
[ <ORDER BY clause> ]
[ <ROW or RANGE clause> ]
)
1. partition by
指定分区的列 ,将查询结果集分为多个分区。 开窗函数分别应用于每个分区,并为每个分区重新启动计算。
只能引用可供 Select 子句使用的列。不能引用选择列表中的表达式或别名。 可以是列表达式、标量子查询、标量函数或用户定义的变量。
2. order by
定义结果集的每个分区中行的 逻辑顺序
指定用于进行排序的列或表达式。 只能引用可供 Select 子句使用的列。 不能将整数指定为表示列名或别名。
如果使用rank类函数,必须有order by;
asc | desc:指定按升序或降序排列。
3. ROWS | RANGE
通过指定分区中的起点和终点,进一步限制分区中的行数。
- 必须和order by 子句同时使用;
- 如果指定了order by 子句未指定窗口子句,则默认为RANGE BETWEEN unbounded preceding AND CURRENT ROW;
- ROWS 子句通过指定 固定数目的行;
- RANGE 子句通过指定 针对当前行中的值的某一范围的值;
- BETWEEN ··· AND ···
与 ROWS 或 RANGE 一起使用,以便指定窗口的下(开始)边界和上(结束)边界点
窗口范围
代码 | 指定窗口 | 用法 |
---|---|---|
未指定窗口子句 | 全部行 | 空 |
current row | 当前行(值) | 指定为既是起点,又是终点 |
unbounded preceding | 在分区中的第一行 | 起点 |
1 preceding | 当前行的前1行(的值) | 起点 |
unbounded preceding | 在分区中的最后一行 | 重点 |
1 following | 当前行的后1行(的值) | 在 * FOLLOWING 指定为窗口起点时,终点必须是 * FOLLOWING |
无符号整数文字 | 指定要置于当前行或值之前或之后的行或值的数目 | 这一指定仅对于 ROWS 有效 |
数据准备:全校的成绩数据
#--创建表
CREATE TABLE StudentScore (
Id int(10) primary key NOT NULL auto_increment,
StudentId int(10) NOT NULL DEFAULT 0,
ClassId int(10) NOT NULL DEFAULT 0,
CourseId int(10) NOT NULL DEFAULT 0,
Score float NOT NULL DEFAULT 0,
CreateDate datetime NOT NULL DEFAULT now()
) ;
#--插入数据
#--CourseId 2:语文 4:数学 8:英语
#--1班学生成绩
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (1,1,2,85);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (2,1,2,95.5);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (3,1,2,90);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (1,1,4,90);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (2,1,4,98);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (3,1,4,89);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (1,1,8,80);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (2,1,8,75.5);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (3,1,8,77);
#--2班学生成绩
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (1,2,2,90);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (2,2,2,77);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (3,2,2,78);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (4,2,2,83);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (1,2,4,98);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (2,2,4,95);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (3,2,4,78);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (4,2,4,100);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (1,2,8,85);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (2,2,8,90);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (3,2,8,86);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (4,2,8,78.5);
#studentscore--3班学生成绩
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (1,3,2,82);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (2,3,2,78);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (3,3,2,91);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (1,3,4,83);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (2,3,4,78);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (3,3,4,99);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (1,3,8,86);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (2,3,8,78);
INSERT INTO StudentScore(StudentId,ClassId,CourseId,Score)VALUES (3,3,8,97);
实操
问答一
前几名学生的成绩合计数
解题:
SELECT studentId,ClassId,CourseId,Score,
sum(score) over(partition by CourseId order by score rows between unbounded preceding and current row) as '移动合计',
sum(score) over(partition by CourseId order by score range between unbounded preceding and current row) as '移动合计',
sum(score) over(partition by CourseId order by score rows between 1 preceding and 1 following) as '移动合计',
sum(score) over(partition by CourseId order by score range between 1 preceding and 1 following) as '移动合计'
FROM test_schema.studentscore
where courseId = 2;
问答二
所有班级所有学生的语文平均分
每一个班级的语文平均分,可根据PARTION BY来进行分组
SELECT studentId,ClassId,CourseId,Score,
avg(score) over() as '语文平均分 全局',
cast(avg(score) over(partition by classId) as decimal(5,2)) as '语文平均分 分班级'
FROM test_schema.studentscore
where courseId = 2;
问答三
按照数学成绩逆序排列:
SELECT studentId,ClassId,CourseId,Score,
row_number() over(order by Score desc) as '数学成绩排名',
rank() over(order by Score desc) as '数学成绩排名',
dense_rank() over(order by Score desc) as '数学成绩排名',
ntile(3) OVER(ORDER BY score DESC) AS '组编号'
FROM test_schema.studentscore
where courseId = 8;
排名函数对比:
函数 | 查询的序号是否连续 | 相同的值处理方式 |
---|---|---|
row_number() | 连续的 | 生成唯一的序号(随机) |
rank() | 不连续的 | 生成相同的序号 |
dense_rank() | 连续的 | 生成相同的序号 |
ntile() | 为每一行分配一个所属的组的编号 | -- |