hadoop配置详解,做大数据必须踏出的第一步

配置hadoop:

第一个:hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_65

选择修改日志文件目录(默认目录内日志文件太多易混):

export HADOOP_LOG_DIR=/var/log/hadoop

第二个:core-site.xml


fs.defaultFS

hdfs://主机名:9000


hadoop.tmp.dir

/home/hadoop/hadoop-2.4.1/tmp

io.file.buffer.size

131072

第三个:hdfs-site.xml

dfs.namenode.secondary.http-address

JD:9001

dfs.namenode.name.dir

file:/usr/local/hadoop-2.4.1/dfs/name

dfs.datanode.data.dir

file:/usr/local/hadoop-2.4.1/dfs/data


dfs.replication

1

dfs.webhdfs.enabled

true

dfs.namenode.datanode.registration.ip-hostname-check

false

 

dfs.permissions 

false 

第四个:mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)


mapreduce.framework.name

yarn

mapreduce.jobhistory.address

JD:10020

mapreduce.jobhistory.webapp.address

JD:19888

第五个:yarn-site.xml


yarn.resourcemanager.hostname

主机名


yarn.nodemanager.aux-services

mapreduce_shuffle

 格式化namenode(首次启动需要先格式化,不然无法启动namenode)

hdfs namenode -format (hadoop namenode -format)

http://192.168.74.141:50070 (HDFS管理界面)

http://192.168.74.141:8088 (MR管理界面)

 常见问题:

1.使用命令上传无法成功上传文件,检查到dfs.replication误设为0;

2.使用eclipse 上传文件,hdfs中只有文件名,大小为0,未上传成功,连接datanode失败



喜欢的朋友不妨关注我前十即送hadoop全套资料!

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 终极算法 关注微信号每天收听我们的消息终极算法为您推送精品阅读 前言 Hadoop 在大数据技术体系中的地位至关...
    Yespon阅读 130,504评论 12 168
  • 一、系统参数配置优化 1、系统内核参数优化配置 修改文件/etc/sysctl.conf,添加如下配置,然后执行s...
    张伟科阅读 3,804评论 0 14
  • 2003年,度过了最最漫长炎热的夏日,SARS病毒被击退,初中的课堂铃声终于响起。 豆蔻年华到底是什么?加了锁的日...
    曹屁阅读 214评论 0 0
  • 金声破曙司晨报, 禽中君子今古褒。 清啼一唱雄姿傲, 尤见风流骨气高。
    白沙六阅读 691评论 0 0
  • 今日立夏,夏天就要来了。 说来也是奇怪的季节,总觉忍不住将其与青春联系起来,好像所有的故事都发生在夏天。春夏冬则是...
    小佩佩lancy阅读 459评论 0 51