环境搭建小攻略

Hadoop的学习使用,提供大概思路;

  • Hadoop的安装和配置
1、下载jdk到Linux的/opt目录下
下载路径:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
2、以超级用户权限解压缩
sudo tar -xvf jdk-8u40-linux-i586.tar.gz
3、设置jdk的环境变量
export JAVA_HOME=/opt/jdk1.8.0-40/
export PATH=/opt/jdk1.8.0-40/bin:${PATH}
4、验证jdk是否正确安装
java -version
5、下载hadoop-1.2.1到Linux的/opt目录下
下载地址:http://mirror.bit.edu.cn/apache/hadoop/common/
6、以超级用户权限解压缩
sudo tar -xvf hadoop-1.2.1.tar.gz
7、设置hadoop的环境变量
export HADOOP_HOME=/opt/hadoop-1.2.1/
export PATH=/opt/hadoop-1.2.1/bin:${PATH}
8、设置hadoop的配置文件
cd /opt/hadoop-1.2.1/conf
sudo gedit hadoop-env.sh
9、取消java环境变量的修饰符,并且修改其值
export JAVA_HOME=/opt/jdk1.8.0-40
10、配置SSH免密码登录
生成公钥:ssh-keygen
将公钥内容添加到已授权文件列表中:
cat /home/test/.ssh/id_rsa.pub >>authorized_keys
  • Hadoop的核心架构
主从节点间的通信:
DataNode每三分钟发送一个心跳,报告自己的存活状态,每10个心跳发送数据报告;
NameNode结合数据报告,可以快速生成备份文件;
作业提交与执行:
JobTracker通过调度管理算法,管理TaskTracker;
TaskTracker申请Map或者Reduce任务,在HDFS的存储节点执行;
  • 伪分布式集群配置
1、进入配置文件目录
cd /opt/hadoop/conf
2、以超级用户权限配置core-site.xml
sudo gedit core-site.xml
<configuration>
  <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost</value>
  </property>
</configuration>
3、以超级用户权限配置hdfs-site.xml
sudo gedit hdfs-site.xml
<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>
4、以超级用户权限配置mapred-site.xml
sudo gedit mapred-site.xml
<configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:8021</value>
  </property>
</configuration>
5、hdfs文件系统格式化
hadoop namenode -format
6、开启hdfs和mapreduce进程
cd /opt/hadoop/bin
sudo chown -hR test /opt/hadoop-1.2.1
start-all.sh
  • 完全分布式集群配置
1、基础设置
虚拟机设置为内网模式,ip分别为:
主节点:192.168.56.11 从节点1:192.168.56.12 从节点2:192.168.56.13
每个节点均进行上文中谈到的Hadoop安装和配置;
2、主节点以超级用户权限配置core-site.xml
sudo gedit core-site.xml
<configuration>
  <property>
    <name>fs.default.name</name>
    <value>hdfs://192.168.56.11:9000</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/home/test/hadoop-data/tmp</value>
  </property>
</configuration>
3、主节点以超级用户权限配置hdfs-site.xml
sudo gedit hdfs-site.xml
<configuration>
  <property>
    <name>dfs.name.dir</name>
    <value>/home/test/hadoop-data/hdfs/name</value>
  </property>
  <property>
    <name>fs.data.dir</name>
    <value>/home/test/hadoop-data/hdfs/data</value>
  </property>
  <property>
    <name>dfs.replication</name>
    <value>2</value>
  </property>
</configuration>
4、主节点以超级用户权限配置mapred-site.xml
sudo gedit mapred-site.xml
<configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>192.168.56.11:9001</value>
  </property>
</configuration>
5、主节点配置从节点
sudo gedit /opt/hadoop-1.2.1/conf/slaves
localhost
192.168.56.12
192.168.56.13
6、主节点设置免密码登录
生成公钥:ssh-keygen
将公钥内容添加到已授权文件列表中:
cat /home/test/.ssh/id_rsa.pub >>authorized_keys
7、在从节点上将主节点的公钥复制到从节点上
scp test@192.168.56.11:/home/test/.ssh/id_rsa.pub /home/test/.ssh/
8、在从节点上将主节点的hadoop文件夹复制到从节点上
scp -r test@192.168.56.11:/opt/hadoop-1.2.1/ /opt/
9、在从节点上将公钥文件添加到已授权的文件列表中
cat /home/test/.ssh/id_rsa.pub >> /home/test/.ssh/authorized_keys
10、在主节点上进行hdfs格式化
hadoop namenode -format
11、在主节点上启动
/opt/hadoop-1.2.1/bin/start-dfs.sh

hadoop文件配置属性集合
以上的配置为Hadoop1.2.1下,文件放置在/opt目录下,用户名为test;

  • YARN的伪分布式安装(Hadoop2.6.0环境,已经进行)
1、以超级用户权限创建用户组
addgroup hadoop
adduser --ingroup hadoop hduser
2、以超级用户权限在根目录创建hadoop文件夹
mkdir hadoop
3、更改hadoop文件夹得所有者
chown hduser:hadoop hadoop
4、更改/tmp/hadoop-2.6.0.tar.gz的所有者
chown hduser:hadoop hadoop-2.6.0.tar.gz
5、将/tmp/hadoop-2.6.0.tar.gz复制到/hadoop文件夹中
完成类似于上面的hadoop配置后,下面正式开始YARN配置:
1、配置core-site.xml
<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>
</configuration>
2、配置hdfs-site.xml
<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>
3、配置mapred-site.xml
cp mapred-site.xml.template mapred-site.xml 
<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>
4、配置yarn-site.xml
<configuration>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
</configuration>
5、启动yarn
cd /hadoop/hadoop-2.6.0/sbin
./start-yarn.sh
6、在浏览器中验证是否正确启动(使用本地主机IP)
http://10.0.0.14:8088/

Yarn的工作原理

以上的配置为YARN的伪分布安装

  • HIVE的内嵌模式安装和配置
1、下载和解压
下载地址:wget http://www.motorlogy.com/apache/hive/stable/apache-hive-1.2.1-bin.tar.gz
解压缩:tar zxvf apache-hive-1.2.1-bin.tar.gz
2、设置环境变量
export HIVE_HOME=/home/lzw/apache-hive-1.2.1-bin
export PATH=$HIVE_HOME/bin:
3、配置hive-site.xml
cd /conf
cp hive-default.xml.template hive-default.xml
cp hive-default.xml.template hive-set.xml
4、启动及修改权限
hive 发生运行时异常,原因是hadoop/temp/hive的文件权限不够,修改权限
hadoop fs -chmod -R 777 /tmp/hive
hive 
5、创建表
create table student(
   name string,
   sex string,
   age int   
);
6、验证内嵌模式是否安装成功
show tables;
desc student;
  • HIVE的独立模式安装
1、以超级用户权限下载mysql,并且启动
yum install -y mysql mysql-server
service mysqld start
2、以root用户登录,创建hive用户,hive数据库,并且赋予一定权限
mysql -uroot
create user 'hive' by indentified 'hive';
create database hive;
grant all privileges on *.* to 'hive'@'localhost' indentified by 'hive';
flush  privileges;
msyql -uhive -p
3、下载mysql连接器,并且将解压后的连接器移动到hive的lib目录中
tar -zxvf mysql-connector-java-5.1.35.tar.gz
mv  mysql-connector-java-5.1.35-bin.jar ../apache-hive-1.2.1-bin/lib/
4、修改hive的配置文件
vim hive-set.xml 
<property>
   <name>javax.jdo.option.ConnectionURL</name>
   <value>jdbc:mysql://localhost:3306/hive</value>
</property>
<property>
   <name>javax.jdo.option.ConnectionDriverName</name>
   <value>com.mysql.jdbc.Driver</value>
</property>
<property>
   <name>javax.jdo.option.ConnectionUserName</name>
   <value>hive</value>
</property>
<property>
   <name>javax.jdo.option.ConnectionPassword</name>
   <value>hive</value>
</property>
5、查看mysql中的hive数据库
mysql -uhive -p
use hive;
show tables;##首次启动hive产生多种表,均为元数据
6、在hive中创建student表,并且在mysql的元数据中查看
create table student(
   name string,
   sex string,
   age int   
);
select * from TBLS;

Hive数据存储原理
Hive技术原理解析
Hive类sql语句

zookeeper的学习和使用

  • zookeeper的安装和配置
1、安装环境
虚拟机局域网设置:
192.168.1.105、192.168.1.106、192.168.1.107
基于secureCRT实现远程连接:
同一台机器上,虚拟机设置为net和桥接模式均可
2、secureCRT连接三个节点
3、在三个节点上进行zookeeper的下载、解压缩
cd /opt
wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/stable/zookeeper-3.4.6.tar.gz
tar xzvf zookeeper-3.4.6.tar.gz
mv zookeeper-3.4.6.tar.gz zookeeper
4、在105上面进行配置
cd zookeeper/conf/
cp zoo_sample.cfg zoo.cfg
vim zoo.cfg
修改内容如下:
dataDir=/var/zookeeper
clientPort=2181
server.1=192.168.1.105=2888=3888(leader和follower的端口号)
server.2=192.168.1.106=2888=3888
server.3=192.168.1.107=2888=3888
scp zoo.cof root@192.168.1.106:/opt/zookeeper/conf
scp zoo.cof root@192.168.1.107:/opt/zookeeper/conf
5、创建标识文件
cd /var
mkdir zookeeper
vim myid
填写标识
1
分别在106和107上面进行相同操作,内容为2和3
6、开启zookeeper服务(当zookeeper服务集群中一般服务器开启时,才可以启动)
cd /opt/zookeeper/bin
./zkServer.sh start
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,029评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,238评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,576评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,214评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,324评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,392评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,416评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,196评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,631评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,919评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,090评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,767评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,410评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,090评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,328评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,952评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,979评论 2 351

推荐阅读更多精彩内容