题目
Table: Views
+---------------+---------+
| Column Name | Type |
+---------------+---------+
| article_id | int |
| author_id | int |
| viewer_id | int |
| view_date | date |
+---------------+---------+
此表无主键,因此可能会存在重复行。此表的每一行都表示某人在某天浏览了某位作者的某篇文章。 请注意,同一人的 author_id 和 viewer_id 是相同的。
编写一条 SQL 查询来找出在同一天阅读至少两篇文章的人,结果按照 id 升序排序。
查询结果的格式如下:
Views table:
+------------+-----------+-----------+------------+
| article_id | author_id | viewer_id | view_date |
+------------+-----------+-----------+------------+
| 1 | 3 | 5 | 2019-08-01 |
| 3 | 4 | 5 | 2019-08-01 |
| 1 | 3 | 6 | 2019-08-02 |
| 2 | 7 | 7 | 2019-08-01 |
| 2 | 7 | 6 | 2019-08-02 |
| 4 | 7 | 1 | 2019-07-22 |
| 3 | 4 | 4 | 2019-07-21 |
| 3 | 4 | 4 | 2019-07-21 |
+------------+-----------+-----------+------------+
Result table:
+------+
| id |
+------+
| 5 |
| 6 |
+------+
解答
对view_date和viewer_id分组 统计article_id的去重数量
可以得到每个人每天阅读文章的数量
select view_date, V.viewer_id, count(distinct V.article_id)
from Views as V
group by V.view_date, V.viewer_id
选出至少读两篇文章的人
select V.viewer_id as id
from Views as V
group by V.view_date, V.viewer_id
having count(distinct V.article_id) >= 2
order by id asc;
自连接
select distinct v.viewer_id id from Views v
inner join Views vv
-- 浏览者和浏览时间是同一个
on v.viewer_id = vv.viewer_id and v.view_date = vv.view_date
-- 但浏览的文章不是同一个
and v.article_id <> vv.article_id
order by id