ps:记录学习
一、实验目的
- 在Hadoop的基础上完成Hbase的下载、安装
二、实验要求
- jps查看进程是否正常
三、实验原理
- 基于Ubuntu 16.04搭建
- Hbase是一个高可靠性、高性能、面向列、可伸缩的分布式数据库。利用Hbase技术可在廉价PC Server上搭建起大规模结构化存储集群。
- Hbase是非关系型数据库,它不要求数据之间有严格的关系,同时它允许在同一列不同行中存储不同类型的数据。Hbase作为Hadoop框架下的数据库,是被设计成在一个服务器集群上运行的。
- 本实验采用node1为主机、node2、node3组成
四、实验步骤
4.1 Hbase下载、安装
1、Hbase下载
http://apache.mirrors.pair.com/hbase/ 上下载
注意:根据已搭建好的Hadoop的版本选择能被兼容的Hbase版本
2、Hbase安装
将压缩包解压到制定目录,本次解压在hadoop用户下
$cd /home/hadoop/
$tar -zxvf hbase-1.3.1-bin.tar.gz
解压后可将Hbase目录重命名为hbase
$mv hbase-1.3.1 hbase
4.2 Hbase配置
1、添加Hbasse到环境变量
进入.bashrc文件,修改变量
$vi ~/.bashrc
125 export HBASE_HOME=/home/hadoop/hbase
125 export PATH=$PATH:$HBASE_HOME/bin
使环境变量生效
$source ~/.bashrc
2、配置文件:/home/hadoop/hbase/conf/hbase-env.sh
27 export JAVA_HOME=/home/hadoop/jdk/
28 export HBASE_CLASSPATH=/home/hadoop/hadoop/etc/hadoop/
29 export HBASE_MANAGES_ZK=ture
将false改成true,使用hbase的内置zookeeper
3、配置文件:/home/hadoop/hbase/conf/hbase-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>hbase.rootdir</name>
<!-- 此属性要根据自己的hadoop的配置信息进行相应的修改 -->
<value>hdfs://node1:8020/hbase</value> >
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>node1,node2,nodep3</value>
</property>
</configuration>
hbase.rootdir是ReqionServer的共享目录,用来持久化储存Hbase数据,默认是写到/tmp的,如果不修改此配置,在Hbase重启时,数据会丢失。本机主机名是node1,端口是8020,则需要设置为hdfs://node1:8020/hbase。
hbase.cluster.distributed是用来配置Hbase的部署模式,true表示完全分布式模式。
hbase.zookeeper.quorum是配置Zookeeper集群所在的主机地址,node1,node2,node3是运行数据节点的主机地址。
4、配置文件:/home/hadoop/hbase/conf/regionservers
1 node2
2 node3
slaves节点出现HRegionServers进程
5、远程分发到另外两台主机
配置完后,将已配置好文件远程分发到另外两台主机上
$scp -r /home/hadoop/hbase hadoop@node2:/home/hadoop/
$scp -r /home/hadoop/hbase hadoop@node3:/home/hadoop/
4.3 Hbase配置
首先启动Hadoop
$start-dfs.sh
$start-yarn.sh
jps检测下
再启动Hbase
$start-hbase.sh
在master节点运行添加有Hmaster和HQuorumPeer进程,在slave节点上运行添加有HRegionServer和HQuorumPeer进程。