Hive是大数据(hadoop)生态系统非常重要的一个工具,它提供了一种类SQL的语言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据,也可以查询Hadoop数据库(Hbase)中的数据,可以说通过Hive这个数据仓库工具大大降低了开发难度,对于数据分析师来说真的非常友好,只要使用SQL语言的分析师就可以轻松的使用Hive玩转大数据,当然Hive和其他的基于SQL的环境还是有一些差异,所以通过写这一系列文章来帮助数据分析人员学习Hive使用。
下面是学习Hive整体知识框架,我们会从最基本的安装配置到项目实战进行讲解,当然遇到疑惑的问题,一定要学会去思考和解决,你可以去百度,当然也可以和小编一起探讨。
Hive基础知识
Hive安装使用
Hive数据类型与文件格式
Hive数据定义(DDL)
Hive数据操作(DML)
Hive查询
函数
压缩和存储
调优
项目实战
文章最后:
1.Hive官网地址
Apache Hive TMhive.apache.org
2.Hive文档查看地址
Apache Software Foundationcwiki.apache.org
3.Hive下载地址
Index of /dist/hivearchive.apache.org
4.github地址