一、基本SQL语句
1、基本执行顺序
SELECT
DISTINGCT(T1.name)
FROM table_name1 T1
JOIN table_name2 T2
ON T2.t1_id = T1.id
WHERE T1.name = 'test'
GROUP BY T1.class
HAVING AVG(T1.age)
ORDER BY createTime DESC
LIMIT 1,10;
2、说明
FORM: 对FROM的左边的表和右边的表计算笛卡尔积。产生虚表VT1
ON: 对虚表VT1进行ON筛选,只有那些符合<join-condition>的行才会被记录在虚表VT2中。
JOIN: 如果指定了OUTER JOIN(比如left join、 right join),那么保留表中未匹配的行就会作为外部行添加到虚拟表VT2中,产生虚拟表VT3, rug from子句中包含两个以上的表的话,那么就会对上一个join连接产生的结果VT3和下一个表重复执行步骤1~3这三个步骤,一直到处理完所有的表为止。
WHERE: 对虚拟表VT3进行WHERE条件过滤。只有符合<where-condition>的记录才会被插入到虚拟表VT4中
GROUP BY: 根据group by子句中的列,对VT4中的记录进行分组操作,产生VT5.
CUBE | ROLLUP: 对表VT5进行cube或者rollup操作,产生表VT6.
HAVING: 对虚拟表VT6应用having过滤,只有符合<having-condition>的记录才会被 插入到虚拟表VT7中。
SELECT: 执行select操作,选择指定的列,插入到虚拟表VT8中。
DISTINCT: 对VT8中的记录进行去重。产生虚拟表VT9.
ORDER BY: 将虚拟表VT9中的记录按照<order_by_list>进行排序操作,产生虚拟表VT10.
LIMIT:取出指定行的记录,产生虚拟表VT11, 并将结果返回。
- 写的顺序:
select ... from. where.. group by.. having.. order by.. limit [offset,] (rows)
- 执行顺序:
from... where...group by... having.... select ... order by... limit
3、WHERE、HAVING 的区别
WHERE
是一个约束声明,使用Where来约束来之数据库的数据,Where是在结果返回之前起作用的,且Where中不能使用聚合函数。HAVING
是一个过滤声明,是在查询返回结果集以后对查询结果进行的过滤操作,在Having中可以使用聚合函数。HAVING
子句可以让我们筛选成组后的各组数据,WHERE
子句在聚合前先筛选记录,也就是说作用在GROUP BY
子句和HAVING子
句前;而HAVING
子句在聚合后对组记录进行筛选。
1、实例
- 显示每个地区的总人口数和总面积:
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
先以region把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。
- 显示每个地区的总人口数和总面积.仅显示那些人口数量超过1000000的地区。并通过sum后的字段进行排序
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(population)>1000000
ORDER BY sum(population) desc
<font color='red'>用having就一定要和group by连用,
用group by不一有having (它只是一个筛选条件用的)</font>
二、聚合函数
1、常用聚合函数
- 平均值
AVG
- 标准偏差
STDEV
- 方差
VAR
- 最大值
MAX
- 最小值
MIN
- 合计
SUM
- 次数
COUNT
- 极差值
MAX-MIN
- 变异系数
STDEV/AVG*100
SELECT Name AS '射击手' ,
AVG(Score) AS '平均值' ,
STDEV(Score) AS '标准偏差' ,
VAR(Score) AS '方差' ,
MAX(Score) AS '最大值' ,
MIN(Score) AS '最小值' ,
MAX(Score) - MIN(Score) AS '极差值' ,
STDEV(Score) / AVG(Score) AS '变异系数' ,
COUNT(Score) AS '次数'
FROM @t1
GROUP BY Name
2、为什么要用标准差?
方差和标准差时表示一组数据离散程度的最好指标,是最常用的差异量数。
-
其特点有:
- 1、反应灵敏,每个数据变化都应在方差上体现;
- 2、计算严密;
- 3、容易计算;
- 4、适合代数运算;
- 5、受抽样变动影响小;
- 6、简单明了;
- 7、容易受极端数据影响。
计算方差的步骤可概括为“先平均,后求差,平方后,再平均”.
方差用来衡量一批数据的波动大小.(即这批数据偏离平均数的大小).
方差越大,说明数据的波动越大,越不稳定.
3、变异系数:
变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。
4、极差值:
指一组数据中最大数据与最小数据的差,在统计中常用极差来刻画一组数据的离散程度。
4、注意
having放在group by 的后面
group by 后面只能放非聚合函数的列
where 子句的作用是在对查询结果进行分组前,将不符合where条件的行去掉,即在分组之前过滤数据,条件中不能包含聚组函数,使用where条件显示特定的行。
having 子句的作用是筛选满足条件的组,即在分组之后过滤数据,条件中经常包含聚组函数,使用having 条件显示特定的组,也可以使用多个分组标准进行分组。
用having就一定要和group by连用,
用group by不一有having (它只是一个筛选条件用的
三、实例
- 查询每个租户对应的用户数量,且用户数量大于10,并且以数量倒序排序
SELECT a.tenantId,COUNT(1)
FROM fsmuserex a
WHERE !a.deleted
GROUP BY a.tenantId
HAVING COUNT(1) > 10
ORDER BY COUNT(1) DESC;