登录注册写文章

HIVE认识

高宇的简书昵称

HIVE认识

Hive是建立在Hadoop之上的"数据仓库工具"，它让你能用写SQL的方式来处理海量数据。

流程：

你的SQL查询 → Hive → 转换成MapReduce/Spark任务 → Hadoop集群执行 → 返回结果给你
hive 不是数据库，而是数据仓库，数据仓库不是大的数据库的概念。
hive是用来更方便的操作hadoop的，可以仅用HQL（类似于SQL语法）来操作大数据。

⚡ Hive的特点
优点
简单易用：会SQL就能用
扩展性强：可处理PB级数据
成本低：建立在开源Hadoop之上
成熟稳定：经过多年企业验证

缺点（重要！）
延迟高：不适合实时查询（分钟级响应）
不支持事务：不是OLTP数据库
不支持更新/删除：主要是追加和查询（Hive新版本支持有限更新）

image.png

💡核心要点总结

1.Hive不是数据库，而是数据仓库工具

2.Hive不是实时系统，适合离线分析

3.Hive用SQL操作，但背后是MapReduce/Spark

4.Hive处理海量数据，但响应较慢

5.Hive建立在Hadoop之上，依赖HDFS存储

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

了解hive基础知识
Hive是基于Hadoop的数据仓库工具，可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理，提...
裘马轻狂大帅阅读 3,349评论 0赞 7
一定要弄懂的Hive基础知识
Hive是基于Hadoop的数据仓库工具，可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理，提...
丨程序之道丨阅读 8,984评论 0赞 6

Hive基础知识
Hive是构建在Hadoop HDFS上得一个数据仓库数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化...
Sx_Ren阅读 4,474评论 0赞 9
Hive 基础知识
Hive的安装步骤可以参考：https://www.cnblogs.com/kinginme/p/7233315....
edwin1993阅读 5,084评论 0赞 4
大数据相关基础知识-Hive
参考文档 1.http://blog.csdn.net/zhongqi2513/article/details/6...
剑御阅读 4,353评论 0赞 2

赞1赞

赞赏

手机看全文