Hive练习

数据:

u01 2017/1/21   5
u02 2017/1/23   6
u03 2017/1/22   8
u04 2017/1/20   3
u01 2017/1/23   6
u01 2017/2/21   8
u02 2017/1/23   6
u01 2017/2/22   4

建表语句

create table action(
userId string,
visitDate string,
visitCount string) 
row format delimited fields terminated by "\t";

load data local inpath '/home/data/test.txt' into table action;
image.png

1、输出的日期格式不一样,需进行格式化

select 
  userId,
  date_format(regexp_replace(visitDate,'/','-'),'yyyy-MM') mn,
  visitCount
from
  action; t1
Snipaste_2020-06-10_15-14-24.png

2、计算每个用户的小计

select
  userId,
  mn,
  sum(visitcount) as sum_visitcount
from
  ()t1
group by
  userId,mn; t2

Snipaste_2020-06-10_15-18-33.png

3、按照人和时间进行累加
计算累加列,开窗函数根据用户id分区,按照格式化后的日期进行排序

select
  userId,
  mn,
  sum_visitCount,
  sum(sum_visitCount) over(partition by userId order by mn)
from
  ()t2;

二、

image.png

1、每个店铺的UV(访客数)
步骤一、去重

//group by 去重
select
  shop,
  user_id
from
  visit
group by shop,user_id; t1
Snipaste_2020-06-10_15-42-31.png

步骤二、计数
count(*)进行计数

select
  shop
  count(*) uv
from
  ()t1
group by shop;
Snipaste_2020-06-10_15-45-31.png

2、每个店铺访问次数top3的访客信息。输出店铺名称、访客id、访问次数
步骤一
输出结果应该类似:

a  u1 3
a  u2 2

先计算每个人访问店铺的总次数

select
  shop,
  user_id,
  count(*) ct
from
  visit
group by shop,user_id; t1
Snipaste_2020-06-10_15-49-54.png

步骤二、对同一店铺,对访问次数进行倒序排序 添加rank值,并取前三名

select
  shop,
  user_id,
  ct,
  row_number()over(partition by shop order by ct desc) rk
from
  ()t1; t2

//取前三名
select
  shop,
  user_id,
  ct
from t2
where rk<=3;
Snipaste_2020-06-10_16-29-06.png

三、

image.png

建表、导入数据,设置Hive的本地模式(运行更快)

create table user_low_carbon(user_id String,data_dt String,low_carbon int) row format delimited fields terminated by '\t';
create table plant_carbon(plant_id string,plant_name String,low_carbon int) row format delimited fields terminated by '\t';

load data local inpath "/home/data/user_low_carbon.txt" into table user_low_carbon;
load data local inpath "/home/data/plant_carbon.txt" into table plant_carbon;

set hive.exec.mode.local.auto=true; //本地模式
数据说明

1、统计每个用户到2017/10/1总低碳量
日期格式需要转换,group by 去重,申领沙柳的前10,也可以转换为低碳总量的前10,保险起见limit15

select
  user_id,
  sum(low_carbon) sum_low_carbon
from
  user_low_carbon
where
  date_format(regexp_replace(data_dt,'/','-'),'yyyy-MM-dd')<='2017-10-01'
group by
  user_id
order by
  sum_low_carbon desc
limit 15; t1        //提前过滤能优化查询
image.png

2、取出胡杨的能量、取出沙柳的能量

select
  low_carbon from plant_carbon where plant_id='p004'; t2
select
  low_carbon from plant_carbon where plant_id='p002'; t3

3.每个人申领沙柳的棵树
floor取整

select
  user_id,
  floor((sum_low_carbon-t2.low_carbon)/t3.low_carbon) plant_count
from
  t1,t2,t3; t4
image.png

4、按照申领沙柳棵树排序 将下一行数据中的plant_count放置当前行
//当前行减去下一行,lead

select
  user_id,
  plant_count,
  lead(plant_count,1,'9999') over(order by plant_count desc)lead_plant_count
from
  ()t4
limit 10; t5
image.png

5、求相差的棵树

select
  user_id,
  plant_count,
  (plant_count-lead_plant_count) less_count
from 
  ()t5
order by
  plant_count desc;
image.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,377评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,390评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,967评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,344评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,441评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,492评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,497评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,274评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,732评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,008评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,184评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,837评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,520评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,156评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,407评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,056评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,074评论 2 352