Hive如何在GROUP BY 后,获取每个GROUP的Top N

SELECT page-id, user-id, clicks  
FROM (  
    SELECT page-id, user-id, rank(page-id) as rank, clicks FROM (  
        SELECT page-id, user-id, clicks FROM mytable  
        DISTRIBUTE BY page-id  
        SORT BY page-id, clicks desc  
) a ) b  
WHERE rank < 5  
ORDER BY page-id, rank  
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 什么是爬虫 按照一定规则自动的获取互联网上的信息(如何快速有效的利用互联网上的大量信息) 爬虫的应用 搜索引擎(G...
    imsilence阅读 1,330评论 0 3
  • 十九年后,重耳做了国君,也就是历史上的晋文公。即位后文公重重赏了当初伴随他流亡的功臣,唯独忘了介子推。很多人为介子...
    严小松阅读 246评论 0 0
  • 雪飞如雾,泪眼模糊离家路。 路遥频回首, 家远在心头。 时时常联络, 仍恐别离久。
    意莫安阅读 168评论 1 2
  • 洛妈:一般的国际学校都从3年级开始大量的非小说类阅读要求,四年级➕上学术类写作,这样积累到初中才有这样的阅读速度。...
    iLXR阅读 280评论 0 0