黑猴子的家:Hive 列转行(UDTF)输入一行,输出多行

1、表结构

movie category
《疑犯追踪》 悬疑,动作,科幻,剧情
《Lie to me》 悬疑,警匪,动作,心理,剧情
《战狼2》 战争,动作,灾难

2、movie.txt

《疑犯追踪》  悬疑,动作,科幻,剧情
《Lie to me》  悬疑,警匪,动作,心理,剧情
《战狼2》  战争,动作,灾难

3、创建表

hive> create table movie_info(
    movie string, 
    category array<string>) 
row format delimited fields terminated by "\t"
collection items terminated by ",";

hive 支持数组和字典,创建一个category数组列,用逗号分割

4、导入数据

hive> load data local inpath "movie.txt" into table movie_info;

5、将电影分类中的数组数据展开

统计某一个类型的电影都有哪些

《疑犯追踪》  悬疑,动作,科幻,剧情
《Lie to me》  悬疑,警匪,动作,心理,剧情
《战狼2》  战争,动作,灾难

     ↓

《疑犯追踪》  悬疑
《疑犯追踪》  动作
《疑犯追踪》  科幻
《疑犯追踪》  剧情
《Lie to me》  悬疑
《Lie to me》  警匪
《Lie to me》  动作
《Lie to me》  心理
《Lie to me》  剧情
《战狼2》  战争
《战狼2》  动作
《战狼2》  灾难
select
    movie,
    category_name 
from 
    movie_info lateral view explode(category) table_tmp as category_name;

注释

lateral view   侧写
explode  炸开
table_tmp  侧写表名
category_name 炸开后的数据

当你想从炸开的数据里面,直接获取原表中数据的关系的话,就需要用到侧写
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • ORA-00001: 违反唯一约束条件 (.) 错误说明:当在唯一索引所对应的列上键入重复值时,会触发此异常。 O...
    我想起个好名字阅读 5,450评论 0 9
  • 一、Python简介和环境搭建以及pip的安装 4课时实验课主要内容 【Python简介】: Python 是一个...
    _小老虎_阅读 5,820评论 0 10
  • Zookeeper用于集群主备切换。 YARN让集群具备更好的扩展性。 Spark没有存储能力。 Spark的Ma...
    Yobhel阅读 7,357评论 0 34
  • Apache Zookeeper是一个用于分布式应用程序的分布式开源协调服务。用于分布式的同步、配置维护、组和命名...
    昙花未现阅读 191评论 0 1
  • 人生苦短多珍惜,岁月无情多保重。是是非非少凑合,和和气气长快乐。做人诚实好心态,幸福生活自然来。
    福子_3460阅读 136评论 0 0