175-180 数据库专题一

175.组合两个表

表1: Person

列名	类型
PersonId	int
FirstName	varchar
LastName	varchar

PersonId 是上表主键
表2: Address

列名	类型
AddressId	int
PersonId	int
City	varchar
State	varchar

AddressId 是上表主键
编写一个 SQL 查询，满足条件：无论 person 是否有地址信息，都需要基于上述两表提供 person 的以下信息：

FirstName	LastName	City	State

这道题真的非常基础，练习两表关联。因为提到了无论person是否有地址，都要提供信息。所以应该是LEFT JOIN，也就是以左表为准，所有左表的行都输出对应信息，哪怕右表无对应内容（空着）

SELECT p.FirstName, p.LastName, a.City, a.State -- 建表头
FROM Person p LEFT JOIN Address a               -- p左连接a
ON p.PersonID = a.PersonID                      -- 链接条件

176. 第二高的薪水

编写一个 SQL 查询，获取 Employee 表中第二高的薪水（Salary）。

Id	Salary
1	100
2	200
3	300

例如上述 Employee 表，SQL查询应该返回 200 作为第二高的薪水。如果不存在第二高的薪水，那么查询应返回 null。

SecondHighestSalary
200

不太会排序查找的写法，参照了这篇博客《176. 第二高的薪水》
里面用了两种方法
第一种是用where来限定，先找到最大的，用最大的做限制条件，找到小于最大的的剩余值中最大的，即为第二大的

SELECT max(e.Salary) AS SecondHighestSalary    -- 找出符合条件的最大的+建表头
FROM Employee e          -- 取简写
WHERE e.Salary < (       -- 取出满足小于括号内部值的部分
    SELECT max(e2.Salary) FROM Employee e2  -- 括号内值为整个表最大值
)

第二种是比较正统的，使用limit n,m，取从第n位开始的m个值

SELECT IFNULL((         -- 如果结果为空
  SELECT DISTINCT e.Salary FROM Employee e   -- 此处使用了DISTINCT，因为题目求的是不相同的第二大的，而不是以人为序
    ORDER BY e.Salary    -- 使用工资排序
    DESC limit 1,1),    -- DESC降序 ASC升序
null)                -- 输出null
AS SecondHighestSalary   -- 建表头

177.第N高的薪水

编写一个 SQL 查询，获取 Employee 表中第 n 高的薪水（Salary）。

Id	Salary
1	100
2	200
3	300

例如上述 Employee 表，n = 2 时，应返回第二高的薪水 200。如果不存在第 n 高的薪水，那么查询应返回 null。

getNthHighestSalary(2)
200

这道题是176的延伸，我们可以通过 limit n-1,1来取到对应的值
但是这里存在一个问题，即n-1的值需要提前计算，并存储在新的变量中
参考资料《177. 第N高的薪水》

-- 创建一个函数，N作为INT型参数传入
CREATE FUNCTION getNthHighestSalary(N INT) RETURNS INT
BEGIN
  DECLARE M INT;    -- 声明一个INT型变量M
  SET M = N - 1;    -- 给M设值为N-1
  RETURN (
      # Write your MySQL query statement below.
      SELECT IFNULL(( -- 设置空判断
          SELECT DISTINCT Salary -- 选取不同的Salary
          FROM Employee          -- 来源表
          ORDER BY Salary DESC   -- 排序依据
          LIMIT M, 1             -- 选取M开始的1个数据
      ),null)
  );
END

178.分数排名

编写一个 SQL 查询来实现分数排名。如果两个分数相同，则两个分数排名（Rank）相同。请注意，平分后的下一个名次应该是下一个连续的整数值。换句话说，名次之间不应该有“间隔”。

Id	Score
1	3.50
2	3.65
3	4.00
4	3.85
5	4.00
6	3.65

例如，根据上述给定的 Scores 表，你的查询应该返回（按分数从高到低排列）：

Score	Rank
4.00	1
4.00	1
3.85	2
3.65	3
3.65	3
3.50	4

这道题看起来没有什么难的，引用了新的函数COUNT，计数用。还是两个相同表，一个表用来做左侧索引，另一个表使用COUNT计算，对于表1每一行，有多少个不同的值，大于等于该行的值。即为所求的Rank

但是这个题在实现的时候，我意外发现了另一个问题
首先是一段，全部使用AS做实例化标注的AC代码

SELECT s.Score,
(
    SELECT COUNT(DISTINCT s1.Score)
    FROM Scores s1
    WHERE s1.Score >= s.Score
) AS Rank
FROM Scores s
ORDER BY s.Score DESC

解释起来就是：
列1：从s表取出的成绩列。
列2：
计数（s1表的Score满足条件且不同的数量）
条件：s1表的Score>=s表的Score
整个表使用s表的Score逆序排序

然后是网上的AC代码，参考资料《【LeetCode】178.分数排名》

select Score,
(
    select count(distinct Score) 
    from Scores
    where Score >=s.Score
) Rank
from Scores s 
order by Score DESC;

与第一段代码相似，只是内部的Score没有起名字代表。

接着是我的WA代码（输出结果中所有的Rank均为4）

SELECT Score,
(
    SELECT COUNT(DISTINCT s1.Score)
    FROM Scores s1
    WHERE s1.Score >= Score
) AS Rank
FROM Scores
ORDER BY Score DESC

差异在于，我是外部的Score没有起名字代表。
差异在哪呢？询问了铜鱼（CuFish）和鎕老师（Golden Tang），他告诉我是作用域的问题。
SQL是从FROM先计算，然后反过来计算SELECT内容
使用函数调用来解释，大致是。
首先外部调用FROM Scores，生成一个Score变量
接着SELECT内部调用Scores，生成一个新的Score变量，覆盖了原来的Score变量。此时想调用外部的Score变量，就需要一个类似于实例化的过程，通过调用实例化对象s.Score，找到对应的Score

180.连续出现的数字

编写一个 SQL 查询，查找所有至少连续出现三次的数字。

Id	Num
1	1
2	1
3	1
4	2
5	1
6	2
7	2

例如，给定上面的 Logs 表， 1 是唯一连续出现至少三次的数字。

ConsecutiveNums
1

网上的方法，建了三个同样的表，用来三个表交叉查找
参考资料《180. Consecutive Numbers（连续出现的数字）》

SELECT DISTINCT log1.Num AS ConsecutiveNums
-- 创建表头，使用DISTINCT是因为，可能1连续出现4次或更多，应只输出一次
FROM logs log1, logs log2, logs log3
-- 引用三张表
WHERE log1.Num = log2.Num  -- 限定条件
AND log1.Num = log3.Num
AND log1.Id + 1 = log2.Id
AND log1.Id + 2 = log3.Id

175-180 数据库专题一