linux系统安装
首先,在VMware上创建一个空的虚拟机,配置环境并且把要安装的linux镜像设置到驱动中。
(这里要注意的一点,网络适配器我选的NAT,之前桥接的方式会导致IP地址频繁变化,不利于后期操作)
然后正常运行安装即可。
关于NAT模式下上网的问题,网上的博客已经写得比较清楚。参见:NAT网络配置
但是,这里还需要做一些改动,选中DHCP服务
Hadoop安装和配置
hadoop的安装和配置网上的教程都比较详细了。
这里我参考的是:64位CentOS 6.5下配置Hadoop 2.5.1伪分布式环境
需要注意的几个点
1.修改HDFS的操作权限
需要修改集群中HDFS的配置文件hdfs-site.xml,否则eclipse连接到DFS上只能读文件,不能删除修改
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
2.加载配置文件的信息
由于之前设置Hadoop Location时没有指定Advanced中的配置,因此在/etc/hadoop中修改的配置文件信息不会被Eclipse读取加载,比较方便的做法是直接将修改过的配置文件复制到该工程目录的/src下,具体需要core-site.xml,hdfs-site.xml,log4j.properties三个文件(第三个用于打印日志信息)
3.端口号的设置
在本例中分别为core-site.xml中的9000和yarn-site.xml中的resourcemanager(18040)
4.创建HDFS用户目录
代码:hdfs dfs -mkdir -p /user/hduser