175.组合两个表
表1: Person
列名 | 类型 |
---|---|
PersonId | int |
FirstName | varchar |
LastName | varchar |
PersonId 是上表主键
表2: Address
列名 | 类型 |
---|---|
AddressId | int |
PersonId | int |
City | varchar |
State | varchar |
AddressId 是上表主键
编写一个 SQL 查询,满足条件:无论 person 是否有地址信息,都需要基于上述两表提供 person 的以下信息:
FirstName | LastName | City | State |
---|
这道题真的非常基础,练习两表关联。因为提到了无论person是否有地址,都要提供信息。所以应该是LEFT JOIN,也就是以左表为准,所有左表的行都输出对应信息,哪怕右表无对应内容(空着)
SELECT p.FirstName, p.LastName, a.City, a.State -- 建表头
FROM Person p LEFT JOIN Address a -- p左连接a
ON p.PersonID = a.PersonID -- 链接条件
176. 第二高的薪水
编写一个 SQL 查询,获取 Employee 表中第二高的薪水(Salary) 。
Id | Salary |
---|---|
1 | 100 |
2 | 200 |
3 | 300 |
例如上述 Employee 表,SQL查询应该返回 200 作为第二高的薪水。如果不存在第二高的薪水,那么查询应返回 null。
SecondHighestSalary |
---|
200 |
不太会排序查找的写法,参照了这篇博客《176. 第二高的薪水》
里面用了两种方法
第一种是用where来限定,先找到最大的,用最大的做限制条件,找到小于最大的的剩余值中最大的,即为第二大的
SELECT max(e.Salary) AS SecondHighestSalary -- 找出符合条件的最大的+建表头
FROM Employee e -- 取简写
WHERE e.Salary < ( -- 取出满足小于括号内部值的部分
SELECT max(e2.Salary) FROM Employee e2 -- 括号内值为整个表最大值
)
第二种是比较正统的,使用limit n,m,取从第n位开始的m个值
SELECT IFNULL(( -- 如果结果为空
SELECT DISTINCT e.Salary FROM Employee e -- 此处使用了DISTINCT,因为题目求的是不相同的第二大的,而不是以人为序
ORDER BY e.Salary -- 使用工资排序
DESC limit 1,1), -- DESC降序 ASC升序
null) -- 输出null
AS SecondHighestSalary -- 建表头
177.第N高的薪水
编写一个 SQL 查询,获取 Employee 表中第 n 高的薪水(Salary)。
Id | Salary |
---|---|
1 | 100 |
2 | 200 |
3 | 300 |
例如上述 Employee 表,n = 2 时,应返回第二高的薪水 200。如果不存在第 n 高的薪水,那么查询应返回 null。
getNthHighestSalary(2) |
---|
200 |
这道题是176的延伸,我们可以通过 limit n-1,1来取到对应的值
但是这里存在一个问题,即n-1的值需要提前计算,并存储在新的变量中
参考资料《177. 第N高的薪水》
-- 创建一个函数,N作为INT型参数传入
CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT
BEGIN
DECLARE M INT; -- 声明一个INT型变量M
SET M = N - 1; -- 给M设值为N-1
RETURN (
# Write your MySQL query statement below.
SELECT IFNULL(( -- 设置空判断
SELECT DISTINCT Salary -- 选取不同的Salary
FROM Employee -- 来源表
ORDER BY Salary DESC -- 排序依据
LIMIT M, 1 -- 选取M开始的1个数据
),null)
);
END
178.分数排名
编写一个 SQL 查询来实现分数排名。如果两个分数相同,则两个分数排名(Rank)相同。请注意,平分后的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”。
Id | Score |
---|---|
1 | 3.50 |
2 | 3.65 |
3 | 4.00 |
4 | 3.85 |
5 | 4.00 |
6 | 3.65 |
例如,根据上述给定的 Scores 表,你的查询应该返回(按分数从高到低排列):
Score | Rank |
---|---|
4.00 | 1 |
4.00 | 1 |
3.85 | 2 |
3.65 | 3 |
3.65 | 3 |
3.50 | 4 |
这道题看起来没有什么难的,引用了新的函数COUNT,计数用。还是两个相同表,一个表用来做左侧索引,另一个表使用COUNT计算,对于表1每一行,有多少个不同的值,大于等于该行的值。即为所求的Rank
但是这个题在实现的时候,我意外发现了另一个问题
首先是一段,全部使用AS做实例化标注的AC代码
SELECT s.Score,
(
SELECT COUNT(DISTINCT s1.Score)
FROM Scores s1
WHERE s1.Score >= s.Score
) AS Rank
FROM Scores s
ORDER BY s.Score DESC
解释起来就是:
列1:从s表取出的成绩列。
列2:
计数(s1表的Score满足条件且不同的数量)
条件:s1表的Score>=s表的Score
整个表使用s表的Score逆序排序
然后是网上的AC代码,参考资料《【LeetCode】178.分数排名》
select Score,
(
select count(distinct Score)
from Scores
where Score >=s.Score
) Rank
from Scores s
order by Score DESC;
与第一段代码相似,只是内部的Score没有起名字代表。
接着是我的WA代码(输出结果中所有的Rank均为4)
SELECT Score,
(
SELECT COUNT(DISTINCT s1.Score)
FROM Scores s1
WHERE s1.Score >= Score
) AS Rank
FROM Scores
ORDER BY Score DESC
差异在于,我是外部的Score没有起名字代表。
差异在哪呢?询问了铜鱼(CuFish)和鎕老师(Golden Tang),他告诉我是作用域的问题。
SQL是从FROM先计算,然后反过来计算SELECT内容
使用函数调用来解释,大致是。
首先外部调用FROM Scores,生成一个Score变量
接着SELECT内部调用Scores,生成一个新的Score变量,覆盖了原来的Score变量。此时想调用外部的Score变量,就需要一个类似于实例化的过程,通过调用实例化对象s.Score,找到对应的Score
180.连续出现的数字
编写一个 SQL 查询,查找所有至少连续出现三次的数字。
Id | Num |
---|---|
1 | 1 |
2 | 1 |
3 | 1 |
4 | 2 |
5 | 1 |
6 | 2 |
7 | 2 |
例如,给定上面的 Logs 表, 1 是唯一连续出现至少三次的数字。
ConsecutiveNums |
---|
1 |
网上的方法,建了三个同样的表,用来三个表交叉查找
参考资料《180. Consecutive Numbers(连续出现的数字)》
SELECT DISTINCT log1.Num AS ConsecutiveNums
-- 创建表头,使用DISTINCT是因为,可能1连续出现4次或更多,应只输出一次
FROM logs log1, logs log2, logs log3
-- 引用三张表
WHERE log1.Num = log2.Num -- 限定条件
AND log1.Num = log3.Num
AND log1.Id + 1 = log2.Id
AND log1.Id + 2 = log3.Id