Windows 10 利用Linux子系统配置本地Spark环境

偶然在应用商店看到了一个Ubuntu的应用软件，想了想，在Windows下可以通过直接使用Ubuntu系统吗？
赶紧上网查了一波，发现还真可以，想到最近在学习Spark搞了个虚拟机，突然发现这个比虚拟机好用多了。资源消耗没这么大。
配置一下Spark环境。

Windows 10 启动Linux子系统

打开开发者模式
打开设置

打开更新和安全，点击开发者选项，点击开发人员模式

image.png
更改系统功能
打开电脑控制面板

点击程序，再点击启动或关闭Windows功能

image.png

找到适用于Linux的windows子系统，勾选确定，重启电脑。

image.png
下载Ubuntu
打开应用商店，搜索Ubuntu安装。

image.png

安装完后，点击启动Ubuntu。进行配置用户名，密码等。
完成后启动界面是这样的

image.png

配置ssh

安装ssh服务

sudo apt-get install openssh-client
sudo apt-get install openssh-server

启动、重启ssh服务

sudo service ssh start
sudo service ssh restart

如果遇到问题，重新安装ssh服务

sudo apt-get purge openssh-server
sudo apt-get install openssh-server

配置ssh端口
ssh端口默认是22号端口,修改/etc/ssh/sshd_config

Port 22         #如果和win10的端口号冲突，可以改为其他的
UsePrivilegeSeparation no
PermitRootLogin no         #如果你确实要用root方式登录的话设为yes
PasswordAuthentication yes

配置免密登陆

执行  ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa  生成密钥
执行  ssh-copy-id -i ~/.ssh/id_rsa.pub <username>@localhost  将公钥发送至Ubuntu ,其中<username> 为你的用户名
运行  ssh localhost  查看是否不需要密码登录

安装JDK

官网下载JDK
https://www.oracle.com/technetwork/java/javase/downloads/index.html
安装配置JDK
由于这个ubuntu子系统在C盘目录下，空间不够，我选择把JDK放入到挂载的D盘目录下面。将JDK解压到/mnt/d/usr/local，并且给配置环境变量

sudo tar -zxf ./jdk-12.0.2_linux-x64_bin.tar.gz -C /mnt/d/usr/local/
cd /mnt/d/usr/local/
sudo mv ./ jdk-12.0.2 ./jdk
sudo chown -R gandi ./jdk

#再打开 /home/gandi/.bashrc，添加环境变量
export JAVA_HOME=/mnt/d/usr/local/jdk
export PATH=$JAVA_HOME/bin:$PATH

source ~/.bashrc

因为下载的是最新的jdk-12，所以配置环境变量只需要配置/bin，CLASSPATH这些都不需要了，简化了很多。

安装Hadoop

下载Hadoop
下载Hadoop我们一般去他的镜像网站上下载。我选择下载了Hadoop最新版本hadoop-3.2.0
https://www.apache.org/dyn/closer.cgi/hadoop/common
http://mirror.bit.edu.cn/apache/hadoop/common/
安装配置
解压安装，设置环境变量

sudo tar -zxf ./hadoop-3.2.0.tar.gz -C /mnt/d/usr/local/
cd /mnt/d/usr/local/
sudo mv ./ hadoop-3.2.0 ./hadoop
sudo chown -R gandi ./hadoop

#再打开 /home/gandi/.bashrc，添加环境变量
export HADOOP_HOME=/mnt/d/usr/local/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

source ~/.bashrc

设置JAVA_HOME路径
修改etc/hadoop/hadoop-env.sh文件中的JAVA_HOME变量

export JAVA_HOME=/mnt/d/usr/local/jdk

以伪分布模式配置Hadoop
修改etc/hadoop/core-site.xml 文件内容如下：

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/mnt/d/usr/local/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

# 其中的hadoop.tmp.dir的路径可以根据自己的习惯进行设置

修改etc/hadoop/hdfs-site.xml文件内容如下：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
　　　　<name>dfs.namenode.name.dir</name>
　　　　<value>file:/mnt/d/usr/local/hadoop/tmp/dfs/name</value>
　　</property>
　　<property>
　　　　<name>dfs.datanode.data.dir</name>
　　　　<value>file:/mnt/d/usr/local/hadoop/tmp/dfs/data</value>
　　</property>
</configuration>

修改etc/hadoop/mapred-site.xml文件内容如下：

<configuration>
    <property>
        <name>mapred.job.tracker</name>
        <value>localhost:9001</value>
　　</property>
</configuration>

配置YARN（若你使用YARN作为资源管理器）
修改etc/hadoop/mapred-site.xml文件内容如下：

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

修改etc/hadoop/yarn-site.xml如下：

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

格式化文件系统

hadoop namenode -format

开启 NameNode 和 DataNode 守护进程

start-dfs.sh

开启YARN

start-yarn.sh

查看是否启动成功
输入jps命令，若以下进程都启动了，说明启动成功

7201 SecondaryNameNode
6727 NameNode
7815 Jps
6939 DataNode

安装配置Spark

下载Spark，选择Pre-bulit with user-provided Apache Hadoop
http://spark.apache.org/downloads.html

image.png
安装

sudo tar -zxf spark-2.4.3-bin-without-hadoop.tgz -C /mnt/d/usr/local/
cd /mnt/d/usr/local/
mv spark-2.4.3-bin-without-hadoop/ ./spark
chown -R gandi ./spark/

#再打开 /home/gandi/.bashrc，添加环境变量
export SPARK_HOME=/mnt/d/usr/local/spark
export PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH
source ~/.bashrc

配置

cp spark/conf/slaves.template ./spark/conf/slaves
cp spark/conf/spark-env.sh.template ./spark/conf/spark-env.sh

在spark-env.sh里添加

export JAVA_HOME=/mnt/d/usr/local/jdk
export SPARK_MASTER_IP=localhost
export SPARK_WORKER_MEMORY=4g
export SPARK_DIST_CLASSPATH=$(/mnt/d/usr/local/hadoop/bin/hadoop classpath)

JAVA_HOME：指定的是 Java 的安装目录
SPARK_MASTER_IP：指定的是 Spark 集群的 Master 节点的 IP 地址
SPARK_WORKER_MEMOERY：指定的 Worker 节点能够最大分配给 Excutors 的内存大小、
SPARK_DIST_CLASSPATH：Spark就可以把数据存储到Hadoop分布式文件系统HDFS中

启动Spark-shell，如下图所示，进入了Scala环境，

image.png

在浏览器中输入上图所示的地址：http://desktop-cehk519.volans.router:4040/jobs/

image.png

启动集群，在spark/sbin目录下，start-all.sh

image.png

在浏览器中输入 http://localhost:8080/ ，如下图所示

image.png

Linux子系统文件目录在Windows下面哪个文件夹目录

ubuntu Linux子系统的目录是在这个目录下

C:\Users\用户名\AppData\Local\Packages\CanonicalGroupLimited.UbuntuonWindows_79rhkp1fndgsc\LocalState\rootfs

Linux访问windows文件

windows的磁盘被挂载到了/mnt下，可以直接访问

最后编辑于：2019.11.13 19:35:27

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,277评论 6赞 503
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,689评论 3赞 393
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,624评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,356评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,402评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,292评论 1赞 301
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,135评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,992评论 0赞 275
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,429评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,636评论 3赞 334
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,785评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,492评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,092评论 3赞 328
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,723评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,858评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,891评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,713评论 2赞 354