[一起学Hive]之四-Hive的安装配置

其实Hive的安装配置应该放在第二章来介绍,晚了些,希望对Hive初学者有用。

三、Hive的安装配置

3.1 环境需求

  • Hadoop Client
  • Mysql

3.2 下载并解压Hive0.13.1安装包

下载地址:http://archive.apache.org/dist/hive/hive-0.13.1/apache-hive-0.13.1-bin.tar.gz

cp apache-hive-0.13.1-bin.tar.gz /usr/local

cd /usr/local

tar –xzvf apache-hive-0.13.1-bin.tar.gz

配置环境变量(如果不是root用户,配置自己的~/.bash_profile即可):

vi /etc/profile

export HIVE_HOME=/usr/local/apache-hive-0.13.1-bin

export PATH=$HIVE_HOME/bin: $PATH

source /etc/profile

3.3 在Mysql中建立Hive元数据库和表

root进入Mysql;

CREATE DATABASE hive;

//下面给所有的ip都赋了访问权限,安全起见,

//一般这里只需要对安装Hive Client端的机器IP赋权即可

GRANT ALL ON hive. TO hive@’%’ IDENTIFIED BY ‘hive1234′;*

flush privileges;

3.4 配置hive-site.xml

cd $HIVE_HOME/conf/

新建hive-site.xml, 里面是以下内容:

<?xml version=”1.0″?>
<?xml-stylesheet type=”text/xsl” href=”configuration.xsl”?>
<configuration>
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/hivedata/warehouse/</value>
<description>Hive在HDFS上的根目录</description>
</property>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://127.1.1.102:3306/hive?createDatabaseIfNotExist=true</value>
<description>Hive元数据库的连接串,红色为数据库名</description>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
<description>Hive元数据库JDBC驱动</description>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>hive</value>
<description>Hive元数据库用户名</description>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>hive1234</value>
<description>Hive元数据库密码</description>
</property>
<property>
<name>datanucleus.autoCreateTables</name>
<value>true</value>
<description>不存在时,自动创建Hive元数据表</description>
</property>
<property>
<name>datanucleus.autoCreateColumns</name>
<value>true</value>
<description>不存在时,自动创建Hive元数据列</description>
</property>
<property>
<name>datanucleus.fixedDatastore</name>
<value>false</value>
</property>
<property>
<name>datanucleus.autoStartMechanism</name>
<value>SchemaTable</value>
</property>
</configuration>

  这些是必须的参数,配好就行了,特别注意红色的几个参数,其他可根据实际需求来配置。

3.5 进入Hive-Cli

由于3.3中已经配置了环境变量,因此直接执行hive命令,即可进入Hive-Cli.

如:

[lxw1234@dev ~]$ hive

Logging initialized using configuration in file:/usr/local/apache-hive-0.13.1-bin/conf/hive-log4j.properties

hive>show databases;

OK

default

Time taken: 0.42 seconds, Fetched: 1 row(s)

hive>

第一次执行,Hive需要在元数据库中建立相关的表,因此会稍微感觉慢一些。

3.6 Hive的日志

Hive的日志一般存放在操作系统本地的/tmp/${user.name}/hive.log中,该文件路径由

$HIVE_HOME/conf/hive-log4j.properties中指定,可自己修改该路径。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • HIVE是一个基于Hadoop的数据仓库,适用于一些高延迟性的应用。如果对延迟性要求比较高,则可以选择Hbase。...
    夏无忧阳阅读 5,095评论 0 12
  • 介绍 Hive是运行在Hadoop之上的数据仓库,将结构化的数据文件映射为一张数据库表,提供简单类SQL查询语言,...
    syncwt阅读 4,739评论 0 7
  • 说明:不少读者反馈,想使用开源组件搭建Hadoop平台,然后再部署Kylin,但是遇到各种问题。这里我为读者部署一...
    大诗兄_zl阅读 2,102评论 0 2
  • 一、Hive概述 HIve是什么?为什么要使用hive?对于一个初步接触hive的初学者,这些都是迷惑的,因此本文...
    不清不慎阅读 833评论 0 4
  • 1、运行环境 主机IP 主机名 2、配置主机名(分别在五台机器上执行) hostname +主机名例如: h...
    献给记性不好的自己阅读 3,589评论 0 6