hive sql 基础知识（一）

hive是将SQL语言转换成MapReduce程序并提交到Yarn上运行，读取HDFS上数据进行处理
sql query :类似于MySql数据库的SQL
SQL on Hadoop：建立在Hadoop之上提供SQL方式分析数据的框架（hive-Facebook开源的，presto-京东，spark sql)

image.png
hive中表有内部表和外部表
内部表和外部表区别
1.内部表不吸烟指定数据存放目录，它默认在/user/hive/warehouse/db目录/表名目录
2.而外部表的数据存放目录是可以任意指定的；
3.内部表被删除时，表定义和表数据都会被删除
4.外部表被删除时，表定义会被删除，但是表数据依旧保留
hive启动
bin/hive --启动为一个单机交互式程序
启动为服务
bin/hiveserver2 -- 服务启动在前台，但不接受任何操作
然后查看hive服务是否启动成功：netstat-nltp | grep 10000 等待。。找是否有10000
然后可以用客户端去连接hive 服务，进行sql 操作
bin/beeline -u jdbc:hive2:// localhost:10000-n root
内部表的创建

create table emp
(empo int,
ename string,
job string,
mgr int) row format delimited fields terminated by ',';

(因hive表里默认分隔符是制表符，如果上传的数据是以逗号分隔，需改变分隔符)
hive sql 不能单条修改数据，需要整体修改；

外部表的创建

create external table emp
(empo int,
ename string,
job string,
mgr int) row format delimited fields terminated by ',';

导入数据
方式1：用hdfs命令put到表所在目录
load data inpath '/input/emp.csv' into table emp;
方式2：用hive语句导入
load data local inpath '/root/abc/' into table t1
删除库/表

drop table stu;
drop database mydb;       -- 删除没有表的空库
drop database mydb cascade;     -- 删除非空的库

分区表
分区表跟普通表区别于，分区表的数据可以按照某个标志的不同值，来存储在不同子文件夹中；

create table tf_log (ip string,url string)
partitioned by (dt string) -- 指定分区
row format delimited fields terminated by ',';
 -- 插入数据 对分区表导入数据，必须指定导入到哪个分区
load data local inpath '/root/hivedata/log.2019-12-02' 
into table tf_log partition(dt='2019-12-02')
-- 查询分区信息： show partitions tf_log;
-- 删除一个分区
alter table tf_log drop partition(dt='2109-12-01');
-- 添加分区
alter table tf_log add psrtition(dt='2019-07-14') location '/log14';

插入数据

-- 插入数据
insert into table_1 select * from table_2;  -- 在table_1后追加数据
insert overwrite table_1 select * from table_2;  -- 先将table_1中数据清空，然后添加数据

-- 提取数据常用语句
select [distinct] select_expr_1, select_expr_2
from table_name
[where condition]   -- 筛选条件
[group by col_list [having condition]]  -- 分组、分组返回的条件
[order by col_list]  -- 排序
[limit num_1, num_2]   -- 返回数据的起始位置(num_1)以及返回数据的记录数(num_2)

最后编辑于：2019.12.04 16:22:26

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 222,104评论 6赞 515
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 94,816评论 3赞 399
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 168,697评论 0赞 360
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 59,836评论 1赞 298
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 68,851评论 6赞 397
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 52,441评论 1赞 310
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,992评论 3赞 421
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,899评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 46,457评论 1赞 318
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,529评论 3赞 341
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,664评论 1赞 352
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 36,346评论 5赞 350
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 42,025评论 3赞 334
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,511评论 0赞 24
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,611评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 49,081评论 3赞 377
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,675评论 2赞 359

hive sql 基础知识（一）

推荐阅读更多精彩内容