Hive简介
Hive是基于Hadoop的数据仓库,可以将结构化数据文件映射为一张数据库表,并提供类SQL查询功能。
本质是将SQL转换为MapReduce程序。
主要用来进行离线数据分析,比直接用MapReduce开发效率更高。
Hive架构:

image.png
Hive交互方式
- Hive交互shell
/bin/hive - Hive JDBC服务
- Hive启动为一个服务器,对外提供服务
启动hive服务:bin/hiveserver2
beeline -u jdbc:hive2://xxx.com:10000 -n root
或!connect jdbc:hive2://xxx.com:10000 - Hive 命令
hive -e 'sql'