目标:
9.1 聚集函数
9.2 聚集不同值
9.3 组合聚集函数
这一课介绍什么是 SQL 的聚集函数,如何利用它们汇总表的数据
9.1 聚集函数
聚集函数(aggregate function)
对某些行运行的函数,计算并返回一个值
我们经常需要汇总数据而不用把它们实际检索出来,为此 SQL 提供了专门的函数。使用这些函数,SQL 查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有:
1. 确定表中行数(或者满足某个条件或包含某个特定值的行数);
2. 获得表中某些行的和;
3. 找出表列(或所有行或某些特定的行)的最大值、最小值、平均值。
9.1.1 AVG()函
SELECT AVG(prod_price) AS avg_price
FROM Products;
输出:'6.823333'
SELECT AVG(prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';
输出: 3.865000(特定行的平均值)
注意:
1. 只用于单个列 AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个 AVG()函数。只有一个例外是要从多个列计算出一个值时,本课后面会讲到。
2. AVG()函数忽略列值为 NULL 的行。
9.1.2.COUNT()函数
COUNT()函数有两种使用方式:
使用 COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。
使用 COUNT(column)对特定列中具有值的行进行计数,忽略 NULL 值。
SELECT COUNT(*) AS num_cust
FROM Customers;
输出:# num_cust '5' (Customers 表中顾客的总数)
SELECT COUNT(cust_email) AS num_cust
FROM Customers;
输出:# num_cust '3'
说明:NULL 值 如果指定列名,则 COUNT()函数会忽略指定列的值为 NULL 的行,但如果COUNT()函数中用的是星号(*),则不忽略。
9.1.3 MAX() 函数
SELECT MAX(prod_price) AS max_price
FROM Products;
输出:# max_price '11.99'
提示:对非数值数据使用 MAX()
虽然 MAX()一般用来找出最大的数值或日期值,但许多(并非所有)DBMS 允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,MAX()返回按该列排序后的最后一行。
说明:NULL 值 MAX()函数忽略列值为 NULL 的行。
9.1.4 MIN() 函数
SELECT MIN(prod_price) AS min_price
FROM Products;
输出:# min_price'3.49'
9.1.5 SUM()函数
SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE order_num = 20005;
输出:# items_ordered'200'
SELECT SUM(item_price*quantity) AS total_price
FROM OrderItems
WHERE order_num = 20005;
输出:# total_price'1648.00'
说明:NULL 值 SUM()函数忽略列值为 NULL 的行。
9.2 聚集不同值
以上 5 个聚集函数都可以如下使用。
1. 对所有行执行计算,指定 ALL 参数或不指定参数(因为 ALL 是默认行为)。
2.只包含不同的值,指定 DISTINCT 参数。
SELECT AVG(DISTINCT prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';
输出:# avg_price '4.240000'(平均值只考虑各个不同的价格)
注意:DISTINCT 不能用于 COUNT(*)
如果指定列名,则 DISTINCT 只能用于 COUNT()。DISTINCT 不能用于 COUNT(*)。类似地,DISTINCT 必须使用列名,不能用于计算或表达式。
说明:其他聚集参数
除了这里介绍的 DISTINCT 和 ALL 参数,有的 DBMS 还支持其他参数,如支持对查询结果的子集进行计算的 TOP 和 TOP PERCENT。
9.3 组合聚集函数
实际上,SELECT 语句可根据需要包含多个聚集函数。请看下面的例子:
SELECT COUNT(*) AS num_items,
MIN(prod_price) AS price_min,
MAX(prod_price) AS price_max,
AVG(prod_price) AS price_avg
FROM Products;
输出:# num_items, price_min, price_max, price_avg
'9', '3.49', '11.99', '6.823333'
注意:取别名
在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名。虽然这样做也算合法,但许多 SQL 实现不支持,可能会产生模糊的错误消息。
9.4 小结
聚集函数用来汇总数据。SQL 支持 5 个聚集函数,可以用多种方法使用它们,返回所需的结果。
-- ----------第9课 汇总数据----------------------
SELECT AVG(prod_price) AS avg_price
FROM Products;
SELECT AVG(prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';
SELECT COUNT(*) AS num_cust
FROM Customers;
SELECT COUNT(cust_email) AS num_cust
FROM Customers;
SELECT MAX(prod_price) AS max_price
FROM Products;
SELECT MIN(prod_price) AS min_price
FROM Products;
SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE order_num = 20005;
SELECT SUM(item_price*quantity) AS total_price
FROM OrderItems
WHERE order_num = 20005;
SELECT AVG(DISTINCT prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';
SELECT COUNT(*) AS num_items,
MIN(prod_price) AS price_min,
MAX(prod_price) AS price_max,
AVG(prod_price) AS price_avg
FROM Products;
9.5 挑战题
1. 编写 SQL 语句,确定已售出产品的总数(使用 OrderItems 中的quantity 列)。
SELECT SUM(quantity) AS items_ordered
FROM OrderItems;
2. 修改刚刚创建的语句,确定已售出产品项(prod_item)BR01 的总数。
SELECT SUM(quantity) AS items_ordered_sum1
FROM OrderItems
WHERE prod_id ='BR01';
3. 编写 SQL 语句,确定 Products 表中价格不超过 10 美元的最贵产品的价格(prod_price)。将计算所得的字段命名为 max_price。
SELECT MAX(prod_price) AS max_price
FROM products
WHERE prod_price<=10;