HDFS集群搭建

一、机器准备

假设我们已经准备好了6台，内存100G，硬盘2T容量的机器。

生产中我们最好不要使用全部的磁盘作为datanode的存储空间，以备不时之需。

计算NameNode内存占用量

前提：保守估计需要为每1百万个数据块分配1G内存

上面的集群为6个节点，每个节点的使用1.5T磁盘空间，数据块大小为128M，复本数为3的话，则约有2万个数据块（6 * 1500000(MB)/(128MB * 3)），内存占用不到1G，但是为了充分利用内存我们分配5G足够使用。

二、前置条件

java 1.7或1.8 安装
各个机器间ssh打通（无密码免密码登陆）
- 在每台机器上运行 ssh-keygen 命令
- 将其他机器的 ~/.ssh/id_rsa.pub 文件内容添加到本机 ~/.ssh/authorized_keys 文件中

etc/hadoop/hadoop-env.sh 文件

hadoop-env.sh

.bash_profile文件

.bash_profile

etc/hadoop/core-site.xml文件

core-site.xml

etc/hadoop/hdfs-site.xml文件

hdfs-site.xml

etc/hadoop/slaves文件

将六台机器的hostname添加进去即可

停止HDFS命令 $HADOOP_HOME/sbin/stop-dfs.sh

最后编辑于：2017.12.11 14:42:02

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。