1.4.3.6 Hive的DML操作

总目录:https://www.jianshu.com/p/e406a9bc93a9

Hadoop - 子目录:https://www.jianshu.com/p/9428e443b7fd

什么是DML

DML--数据操纵语言,用来对数据库中的存储数据进行一些简单操作。

数据导入

语法
load data [local] inpath '文件绝对路径' [overwrite] into table student [partition (partcol1=val1,…)];
(1)load data:表示加载数据
(2)local:表示从本地加载数据到 hive 表;否则从 HDFS 加载数据到 hive 表 
(3)inpath:表示加载数据的路径
(4)overwrite:表示覆盖表中已有数据,否则表示追加
(5)into table:表示加载到哪张表
(6)student:表示具体的表
(7)partition:表示上传到指定分区

数据追加

先创建一个表
create table student(id string, name string) row format delimited fields terminated by '\t';

创建表

追加本地文件

load data local inpath '/usr/hive_data/student.txt' into table student;

追加

查询

注:追加本地文件是拷贝,不会影响本地上的数据。

追加hdfs文件
上传到HDFS上
追加hdfs文件
查询

注:追加hdfs文件是移动

数据覆盖

load data local inpath '/usr/hive_data/student.txt' overwrite into table student;

覆盖

查询

这一次导入的数据就会覆盖之前的数据。

数据插入

单条数据插入

insert into table student values(5,"zhaoqi");

插入

基本模式插入

insert into table student select id,name from student where id=1;

查询插入

将查询结果插入到表中。

创建表时导入数据

create table if not exists student5(
id int,name string)
row format delimited fields terminated by '\t'
location '/user/hive/warehouse/student5';
设置location

然后我们把符合这个表格式的文件上传到这个目录,就表示导入数据了。


上传

然后查询一下。


查询

Import导入数据

import table 要接受数据的表 from '要导入数据的绝对路径';

数据导出

Insert导出

insert overwrite local directory
'/usr/hive_data/student'
select * from student;
导出

查看本地

Hadoop命令导出

使用 hadoop dfs -get 下载文件

HIVE shell导出

hive -e 'select * from default.student;' > /usr/hive_data/student_hive;

Export 导出到 HDFS 上

export table default.student to '/user/hive/warehouse/export/student';

清除表中数据

truncate table student;

只能清除内部表数据,不能清除外部表。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 上一篇:094-BigData-22Hive数据类型及操作 一、Hive分区 分区表实际上就是对应一个HDFS文件...
    AncientMing阅读 3,233评论 0 1
  • 快乐大数据第5次课 hive(1)工作原理Hive的执行入口是Driver,执行的SQL语句首先提交到Drive驱...
    快乐大数据阅读 3,526评论 0 0
  • 安装 元素数据存储选择 默认使用derby数据库,不能够多个用户同时使用,多用于测试使用MySQL数据库存储元数据...
    BlackChen阅读 3,211评论 0 1
  • Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。本...
    felix521阅读 5,150评论 0 0
  • Hive高级操作 1.使用LIKE、AS创建表,表重命名,添加、修改、删除列 表结构数据复制 根据已存在的表结构,...
    三万_chenbing阅读 4,803评论 0 2

友情链接更多精彩内容