Docker-搭建Hadoop普通集群

注意:本文使用Docker 搭建普通版的Hadoop集群,Docker基础使用以及命令请自行百度,后续会更新高可用的Hadoop集群搭建、

1.在宿主机上下载好安装包:hadoop-2.8.2.tar.gz  ; jdk1.8共两个包


2.在Docker仓库中拉去镜像

命令:docker pull 镜像名:Tag    //拉取镜像

3.创建容器

命令:

      //以镜像centos:centos6来创建名字为 centos6_java的容器 并在后台运行{-d:后台运行参数}

      docker -i -t -d --name centos6_java centos:centos6

创建容器

4.安装java1.8

1.从宿主机拷贝jdk到容器中


从宿主机考本文件到容器

2.进入后台运行的容器中

命令:docker exec -it centos6_java bash

进入运行的容器中

3.找到上传的jdk解压并配置环境变量(配置在/etc/profile):

java环境变量配置

4.把容器转变为不可变得镜像

此时我们已经配置好了一个具有java环境的容器,可以将其保存为一个镜像,镜像名字为centos6_java:1.8,注意保存的镜像格式 必须为【imageName:Tag】

提交容器转变为镜像

5.创建Hadoop容器

1. 以刚保存好的java镜像来创建新的容器来安装hadoop

创建新的容器

2.将宿主机上的hadoop压缩包传到容器的 /usr/local目录下,并在容器中解压hadoop压缩包

6.配置Hadoop

配置文件都在hadoop-2.8.2/etc/hadoop目录下

首先创建三个文件:

         1.   mkdir -p  /data/tmp                #hadoop临时目录

         2.   mkdir -p   /data/hdfs/name    #NameNode的存放目录

         3.   mkdir -p   /data/hdfs/data      #DataNode的存放目录


1).core-site.xml配置

<configuration>

    <property>

                <name>fs.default.name</name>

                <value>hdfs://master:9000</value>

                <final>true</final>

        </property>

        <property>

                <name>io.file.buffer.size</name>

                <value>131072</value>

        </property>

        <property>

                <name>hadoop.tmp.dir</name>

                <value>file:/data/tmp</value>

        </property>

</configuration>

注意了:hdfs://master:9000,指向的是一个Master节点的主机,此时还未配置,后续做集群配置时再配置


2).hdfs-site.xml配置

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>2</value>

        <final>true</final>

        <description>Default block replication.

        The actual number of replications can be specified when the file is created.

        The default is used if replication is not specified in create time.

        </description>

    </property>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>file:/data/hdfs/name</value>

        <final>true</final>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>file:/data/hdfs/data</value>

        <final>true</final>

    </property>

</configuration>


3).mapred-site.xml配置

<configuration>

    <property>

        <name>mapred.job.tracker</name>

        <value>master:9001</value>

        <description>The host and port that the MapReduce job tracker runs

        at.  If "local", then jobs are run in-process as a single map

        and reduce task.

        </description>

    </property>

</configuration>


4)修改hadoop-env.sh文件

在最下方添加java环境变量

export  JAVA_HOME=/usr/local/jdk1.8.0_141


5).格式化namenode

执行命令:hadoop namenode -format,如果命令不存在,执行source /etc/profile,在执行hadoop namenode -format


7.提交容器:

commit  centos6_hadoop   centos6_hadoop:2.8.2


8.Hadoop集群搭建

用已经创建好的centos6_hadoop:2.8.2 的hadoop镜像来搭建集群

我们所要搭建的集群是一个master节点和两个slave

注意:

Docker容器中的ip地址是启动之后自动分配的,且不能手动更改;hostname、hosts配置在容器内修改了,只能在本次容器生命周期内有效。如果容器退出了,重新启动,这两个配置将被还原。且这两个配置无法通过commit命令写入镜像

1)用创建好的hadoop镜像来创建上图中的master,slave1,slave2三个节点

执行如下命令

docker run -it  -h master --name master  centos6_hadoop:2.8.2  #创建master节点

docker run -it  -h slave1  --name slave1  centos6_hadoop:2.8.2  #创建slave1节点

docker run -it  -h slave2 --name  slave2  centos6_hadoop:2.8.2  #创建slave2节点

此时以交互式命令创建容器,如果想让容器以后台模式运行有两种方法:

             1、在容器中 Ctrl + P + Q 退出容器保持后台运行(按住ctrl和P 再按Q)

             2、创建容器时加入  -d 参数

2)配置三个容器的hosts

     获取各个节点ip,然后vim  /etc/hosts,我的配置如下。

    172.17.0.5             master

    172.17.0.6              slave

    172.17.0.7             slave2

3)配置salve (前面遗留下的未配置项)

     在master 容器中  编辑  slaves文件,slaves文件 在hadoop目录下的/etc/hadoop路径下

    添加

               slave1

               slave2

4)配置SSH免密登录

      在master 容器中执行:

     1. cd   ~/

      2.ssh-keygen

      3.ssh-copy-id  -i .ssh/id_rsa.pub root@172.17.0.5  #复制公钥到其他节点

         ssh-copy-id  -i .ssh/id_rsa.pub root@172.17.0.6  #复制公钥到其他节点

         ssh-copy-id  -i .ssh/id_rsa.pub root@172.17.0.7  #复制公钥到其他节点

9.启动Hadoop集群

   在每个容器中先执行:source  /etc/profile

   在master容器中执行 start-all.sh

   在Master容器中执行jps:

        1131   Jps

        492     SecondaryNameNode

        513     NameNode

        1240   ResourceManager

   在slave1容器中执行jps:

        268 NodeManager

         342 Jps

         149 DataNode

  在slave2容器中执行jps:

          371 Jps

          247 NodeManager

          176 DataNode


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,992评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,212评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,535评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,197评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,310评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,383评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,409评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,191评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,621评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,910评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,084评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,763评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,403评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,083评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,318评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,946评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,967评论 2 351