Hive的几种数据导入方式

1.从本地文件系统导入数据到Hive表中

load data local inpath "/path/to/dir" into table tab_name

2.从HDFS上导入数据到Hive表中

          load data inpath "/path/to/hdfs_dir" into table tab_name

3.从别的表中查询数据到Hive表中

基本模式:
insert overwrite table tab_name select ... from tab_name ...;
多插入模式:
from tab_name
insert overwrite table tab_name1 select ....
insert overwrite table tab_name2 select...
Hive不支持用Insert语句一条一条地进行插入操作,也不支持UPDATE操作

4.在创建表的时候从别的表中查询记录并插入相应的表中

在实际情况下,表的输出结果可能很多,不适于显示在控制台上,这时候,将Hive的查询输出结果直接保存在一个新的表中是合适的,我们称这种情况是CTAS
CTAS:
create table tabe_name as select ......
注意:CTAS是原子的,如果select查询失败,则新表不会创建

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容