【MySQL】SQL语句的基本执行顺序详解

一、基本SQL语句

1、基本执行顺序

$\color{red} {7}$ SELECT
$\color{red} {8}$ DISTINGCT(T1.name)
$\color{red} {1}$ FROM table_name1 T1
$\color{red} {3}$ JOIN table_name2 T2
$\color{red} {2}$ ON T2.t1_id = T1.id
$\color{red} {4}$ WHERE T1.name = 'test'
$\color{red} {5}$ GROUP BY T1.class
$\color{red} {6}$ HAVING AVG(T1.age)
$\color{red} {9}$ ORDER BY createTime DESC
$\color{red} {10}$ LIMIT 1,10;

2、说明

FORM: 对FROM的左边的表和右边的表计算笛卡尔积。产生虚表VT1
ON: 对虚表VT1进行ON筛选，只有那些符合<join-condition>的行才会被记录在虚表VT2中。
JOIN：如果指定了OUTER JOIN（比如left join、 right join），那么保留表中未匹配的行就会作为外部行添加到虚拟表VT2中，产生虚拟表VT3, rug from子句中包含两个以上的表的话，那么就会对上一个join连接产生的结果VT3和下一个表重复执行步骤1~3这三个步骤，一直到处理完所有的表为止。
WHERE：对虚拟表VT3进行WHERE条件过滤。只有符合<where-condition>的记录才会被插入到虚拟表VT4中
GROUP BY: 根据group by子句中的列，对VT4中的记录进行分组操作，产生VT5.
CUBE | ROLLUP: 对表VT5进行cube或者rollup操作，产生表VT6.
HAVING：对虚拟表VT6应用having过滤，只有符合<having-condition>的记录才会被插入到虚拟表VT7中。
SELECT：执行select操作，选择指定的列，插入到虚拟表VT8中。
DISTINCT：对VT8中的记录进行去重。产生虚拟表VT9.
ORDER BY: 将虚拟表VT9中的记录按照<order_by_list>进行排序操作，产生虚拟表VT10.
LIMIT：取出指定行的记录，产生虚拟表VT11, 并将结果返回。

写的顺序：

select ... from. where.. group by.. having.. order by.. limit [offset,] (rows)

执行顺序：

from... where...group by... having.... select ... order by... limit

3、WHERE、HAVING 的区别

WHERE 是一个约束声明，使用Where来约束来之数据库的数据，Where是在结果返回之前起作用的，且Where中不能使用聚合函数。
HAVING是一个过滤声明，是在查询返回结果集以后对查询结果进行的过滤操作，在Having中可以使用聚合函数。
HAVING子句可以让我们筛选成组后的各组数据，WHERE子句在聚合前先筛选记录,也就是说作用在GROUP BY 子句和HAVING子句前；而HAVING子句在聚合后对组记录进行筛选。

1、实例

显示每个地区的总人口数和总面积：

SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region

先以region把返回记录分成多个组，这就是GROUP BY的字面含义。分完组后，然后用聚合函数对每组中的不同字段（一或多条记录）作运算。

显示每个地区的总人口数和总面积．仅显示那些人口数量超过1000000的地区。并通过sum后的字段进行排序

SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(population)>1000000
ORDER BY sum(population) desc

<font color='red'>用having就一定要和group by连用，
用group by不一有having （它只是一个筛选条件用的）</font>

二、聚合函数

1、常用聚合函数

平均值AVG
标准偏差STDEV
方差VAR
最大值MAX
最小值MIN
合计SUM
次数COUNT
极差值MAX-MIN
变异系数STDEV/AVG*100

SELECT  Name AS '射击手' ,
        AVG(Score) AS '平均值' ,
        STDEV(Score) AS '标准偏差' ,
        VAR(Score) AS '方差' ,
        MAX(Score) AS '最大值' ,
        MIN(Score) AS '最小值' ,
        MAX(Score) - MIN(Score) AS '极差值' ,
        STDEV(Score) / AVG(Score) AS '变异系数' ,
        COUNT(Score) AS '次数'
FROM    @t1
GROUP BY Name

2、为什么要用标准差?

方差和标准差时表示一组数据离散程度的最好指标，是最常用的差异量数。

其特点有：
- 1、反应灵敏，每个数据变化都应在方差上体现；
- 2、计算严密；
- 3、容易计算；
- 4、适合代数运算；
- 5、受抽样变动影响小；
- 6、简单明了；
- 7、容易受极端数据影响。
计算方差的步骤可概括为“先平均，后求差，平方后，再平均”.
方差用来衡量一批数据的波动大小.(即这批数据偏离平均数的大小).
方差越大,说明数据的波动越大,越不稳定.

3、变异系数：

变异系数又称“标准差率”，是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时，如果度量单位与平均数相同，可以直接利用标准差来比较。如果单位和（或）平均数不同时，比较其变异程度就不能采用标准差，而需采用标准差与平均数的比值（相对值）来比较。

4、极差值：

指一组数据中最大数据与最小数据的差，在统计中常用极差来刻画一组数据的离散程度。

4、注意

having放在group by 的后面
group by 后面只能放非聚合函数的列
where 子句的作用是在对查询结果进行分组前，将不符合where条件的行去掉，即在分组之前过滤数据，条件中不能包含聚组函数，使用where条件显示特定的行。
having 子句的作用是筛选满足条件的组，即在分组之后过滤数据，条件中经常包含聚组函数，使用having 条件显示特定的组，也可以使用多个分组标准进行分组。
用having就一定要和group by连用，
用group by不一有having （它只是一个筛选条件用的

三、实例

查询每个租户对应的用户数量，且用户数量大于10，并且以数量倒序排序

SELECT a.tenantId,COUNT(1) 
FROM fsmuserex a 
WHERE !a.deleted 
GROUP BY a.tenantId 
HAVING COUNT(1) > 10 
ORDER BY COUNT(1) DESC;