1 前期准备
1,需要搭建HDFS
2,需要搭建MapReduce
3,安装mysql( 其它数据库都可以),如果不是很清楚安装mysql,请查看 http://www.linuxidc.com/Linux/2016-09/135288.htm
4,下载hive2.x (http://hive.apache.org/downloads.html)最新的release版即可。
2 hive安装
1,tar -xzvf apache-hive-2.1.1-bin.tar.gz -C /home/hadoop/app/hive #解压到指定的目录。
2,配置hive的环境变量
打开/etc/profile来修改(root用户操作):
export HIVE_HOME=/home/hadoop/app/hive
export PATH=$HIVE_HOME/bin:$HIVE_HOME/conf:$PATH
最后,执行source /etc/profile命令,使环境变量有效。
3,修改hive的配置文件
$ cd /home/hadoop/app/hive/conf
$ cp hive-default.xml.template hive-site.xml
$ vim hive-site.xml修改如下内容
<!-- 设置 hive仓库的HDFS上的位置 -->
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/hive/warehouse</value>
<description>location of default database for the warehouse</description>
</property>
<!-- 设置元数据存放的数据库地址、名字 -->
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hive?useSSL=false</value>
</property>
<!--Driver class名字-->
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
<description>Driver class name for a JDBC metastore</description>
</property>
<!--连接使用的用户名-->
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
<description>Username to use against metastore database</description>
</property>
<!--连接使用的密码-->
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>root</value>
<description>password to use against metastore database</description>
</property>
<!--io相关的临时文件存放位置 -->
<property>
<name>hive.exec.local.scratchdir</name>
<value>/home/hadoop/app/hive_temps</value>
<description>Local scratch space for Hive jobs</description>
</property>
<!--资源临时文件存放位置-->
<property>
<name>hive.downloaded.resources.dir</name>
<value>/home/hadoop/app/hive_temps</value>
<description>Temporary local directory for added resources in the remote file system.</description>
</property>
4,修改 hive-log4j2.properties和hive-exec-log4j2.properties
这两个配置文件都有template,拷贝出来保持默认即可
cp hive-log4j2.properties.template hive-log4j2.properties
cp hive-exec-log4j2.properties.template hive-exec-log4j2.properties
5,在HDFS上创建相关目录
$ $HADOOP_HOME/bin/hadoop fs -mkdir /hive/warehouse
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /hive/warehouse 设置权限
6,在已经安装好的mysql上创建数据库
create database hive;
7,由于使用的mysql,请将mysql的JDBC驱动jar包拷贝到$HIVE_HOME/lib目录下
8,使用schematool初始化
$HIVE_HOME/bin/schematool -dbType mysql -initSchema
运行后在mysql的hive库中,可以查看到如下表
3 启动hive
在hive中可以在$HIVE/bin目录下使用如下命令
./hive
./hiveserver2
如果能正常的显示登录到hive的命令行下,就表示安装成功了;如下图