Spark集群搭建整理

以前有个简书的账号的,结果记不清密码和账户名了,所以重新注册了一个。

      搭建了多次的Spark平台,每次搭建都是直接临时百度,导致搭建时的注意点和知识点非常的零散,每次出状况了再去查找相关的问题答案。这次终于自己买了台全新的机子,有机会再搭建一遍,这次下定决定写个文档,为了方便以后的工作。好了,接下来就是直接记录过程了:

准备步骤:

1.先用虚拟机搭建CentOS系统:CentOS 7 64位,使用镜像文件CentOS-7-x86_64-DVD-1804.iso,因为搭集群环境,所以可以开3台虚拟机,一台主节点,两台从节点,我开了3台虚拟机,虚拟机搭建此处省略。

2.下载jdk-8u171-linux-x64.tar.gz、spark-2.3.1-bin-hadoop2.7.tgz、hadoop-2.7.6.tar.gz文件,为了后面便于区分文件,在/usr的文件目录下分别建立java,spark,hadoop文件夹存放。下载的Spark和hadoop的包要根据官网来下载匹配版本。

3.解压文件到当前目录:tar -zxvf *

4.配置jdk:注意更改Linux中自带的openjdk为自己安装的jdk,更改用到的命令--{sudo update-alternatives --install /usr/lib/java java /usr/lib/jvm/jdk1.7.0_17/bin/java 300}{sudo update-alternatives --install /usr/lib/javac javac /usr/lib/jvm/jdk1.7.0_17/bin/javac 300}{sudo update-alternatives --config java}

  前面两个命令中第一文件路径是系统默认的java安装路径,第二个文件路径是自定义安装的java文件路径


搭建集群:

1.修改主机名称

2.在主节点的/etc/hosts文件中添加主节点的ip和主机名及各个从节点的ip和主机名

3.在各个节点中执行:ssh-keygen -t rsa 然后执行不断回车,然后执行{cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys} {chmod 600 ~/.ssh/authorized_keys}(该步骤生成公钥和私钥)

4.在master节点执行{scp /root/.ssh/id_rsa.pub root@slave1:/root/.ssh/id_rsa.pub.master} {scp /root/.ssh/id_rsa.pub root@slave2:/root/.ssh/id_rsa.pub.master}将主节点的公钥传到从节点上,注意如果scp出现Permission denied, please try again权限不足情况,需要进入两个从节点的/etc/ssh/sshd_config文件下,将PermitRootLogin yes这句代码取消注释即可。然后将主节点中的/etc/hosts文件也传给其他两个节点供其它节点通过host名字识别。

5.在主节点执行{cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys #master}在从节点执行{cat /root/.ssh/id_rsa.pub.master >> /root/.ssh/authorized_keys}这样主节点就可以免密码登陆从节点

6.对各个节点安装Scala:从scala官网下载scala版本的rpm文件存入/usr/scala文件夹中,使用rpm -ivh scala-2.12.2.rpm命令进行默认安装,然后添加SCALA_HOME的环境变量

7.修改环境变量,添加{export HADOOP_HOME=/usr/hadoop/hadoop-2.7.6/}{export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop}{export YARN_CONF_DIR=${HADOOP_HOME}/etc/hadoop}{export PATH=$PATH:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin}

8.修改HADOOP_HOME/etc/hadoop文件夹下的hadoop-env.sh和slaves文件,将hadoop-env.sh中的JAVA_HOME地址改成自定义java安装的绝对路径地址,将slaves文件中添加两个从节点的主机名 9.修改core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml文件,最后格式化namenode {hadoop namenode -format}

core-site.xml

hdfs-site.xml

mapred-site.xml

yarn-site.xml


10.复制master节点的hadoop文件夹到slave1,slave2文件夹内,{scp -r hadoop-2.7.6 root@slave2:/usr/hadoop/}并且slave1,slave2修改/etc/profile文件同master一样

11.各个节点修改相应的配置文件,添加SPARK_HOME等环境变量,修改spark-env.sh,slaves文件,并将/usr/spark/文件下的所有文件传到其他从节点, spark-env.sh

cp spark-env.sh.template spark-env.sh

spark-env.sh

export SCALA_HOME=/usr/share/scala

export JAVA_HOME=/usr/java/jdk1.8.0_171

export SPARK_MASTER_IP=master

export SPARK_WORKER_MEMORY=1g

export HADOOP_CONF_DIR=/usr/hadoop/hadoop-2.7.6/etc/hadoop

export HADOOP_HOME=/usr/hadoop/hadoop-2.7.6

export SPARK_HOME=/usr/spark/spark-2.3.1-bin-hadoop2.7

export SPARK_WORKER_CORES=1

slaves

master

slave1

slave2

scp -r spark-2.3.1-bin-hadoop2.7 root@slave2:/usr/spark/

12.一定要记住关闭各个节点的防火墙,否则会出现只能启动主节点,从节点无法启动的现象。

经过以上的步骤终于把集群环境搭好了,如下图所示:


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,204评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,091评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,548评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,657评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,689评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,554评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,302评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,216评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,661评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,851评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,977评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,697评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,306评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,898评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,019评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,138评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,927评论 2 355

推荐阅读更多精彩内容

  • 最近在学习大数据技术,朋友叫我直接学习Spark,英雄不问出处,菜鸟不问对错,于是我就开始了Spark学习。 为什...
    Plokmijn阅读 26,544评论 6 26
  • grep -A 5 'UPDATE ddt_frequency_car' pub.log 查找向下的五行 ip...
    补刀的靓仔阅读 371评论 0 0
  • 准备工作 vmware + centos7安装略 hostname 设置 防火墙 查看防火墙 更新并安装必要的工具...
    子元_9f0d阅读 490评论 0 0
  • --------"道路是曲折的,前途是光明的。"最近又涉及到了hadoop以及spark的安装,之前课题设计中有要...
    九七学姐阅读 3,046评论 3 5
  • 春已来,花已开!一场春雨后,天晴天蓝,盛开的桃花更加妍丽!即便它是野生的,即便它开在杂草旁,依然阻挡不住它的...
    江夏月阅读 202评论 0 0