hadoop 日志

初学者运行MapReduce作业时,经常会遇到各种错误,由于缺乏经验,往往不知所云,一般直接将终端打印的错误贴到搜索引擎上查找,以借鉴前人的经验。然而,对于hadoop而言,当遇到错误时,第一时间应是查看日志,日志里通产会有详细的错误原因提示,本文将总结Hadoop MapReduce日志存放位置,帮助初学者定位自己遇到的错误。

Hadoop MapReduce日志分为两部分,一部分是服务日志,一部分是作业日志,具体介绍如下:

**1. **Hadoop 1.x****版本

Hadoop 1.x中MapReduce的服务日志包括JobTracker日志和各个TaskTracker日志,他们的日志位置如下:

JobTracker:在JobTracker安装节点上,默认位置是

${hadoop.log.dir}/logs/-jobtracker-.log,该文件每天生成一个,旧的日志后缀是日期,当天的日志文件后缀是“.log”,其中${hadoop.log.dir}默认值是hadoop安装目录,即${HADOOP_HOME}。

TaskTracker:在各个TaskTracker安装节点上,默认位置是

$HADOOP_HOME/logs/-tasktracker-.log,该文件每天生成一个,旧的日志后面会跟一个日志,当天的日志文件后缀是“.log”

作业日志包括jobhistory日志和task日志两部分,其中,jobhistory日志是作业运行日志,包括作业启动时间、结束时间,每个任务的启动时间、结束时间,各种counter信息等,用户可以从这个日志中解析出作业运行的各种信息,是非常有价值的信息。默认存放位置是JobTracker所在节点的${hadoop.log.dir}/history目录下,可通过参数hadoop.job.history.location配置。每个task日志存放在task运行节点上,存放位置是${hadoop.log.dir}/userlogs/<jobid>/<attempt-id>目录下,每个task包含三个日志文件,分别是stdout、stderr和syslog,其中,stdout是通过标准输出打印出来的日志,比如System.out.println,注意,程序中通过标准输出打印的日志并不会直接显示在终端上,而是保存在这个文件中,syslog是通过log4j打印的日志,通常这个日志中包含的有用信息最多,也是错误调试中最关键的参考日志。

**2. **Hadoop 2.x****版本

Hadoop 2.x中YARN系统的服务日志包括ResourceManager日志和各个NodeManager日志,他们的日志位置如下:

ResourceManager日志存放位置是Hadoop安装目录下的logs目录下的yarn--resourcemanager-.log

NodeManager日志存放位置是各个NodeManager节点上hadoop安装目录下的logs目录下的yarn--nodemanager-.log

应用程序日志包括jobhistory日志和Container日志,其中,jobhistory日志是应用程序运行日志,包括应用程序启动时间、结束时间,每个任务的启动时间、结束时间,各种counter信息等。

Container日志包含ApplicationMaster日志和普通Task日志,它们均存放在Hadoop安装目录下的userlogs目录中的application_xxx目录下,其中ApplicationMaster日志目录名称为container_xxx_000001,普通task日志目录名称则为container_xxx_000002,container_xxx_000003,….,同Hadoop 1.x一样,每个目录下包含三个日志文件:stdout、stderr和syslog,且具体含义是一样的。

3. ****总结

Hadoop日志是用户定位问题的最重要渠道,对于初学者而言,往往意识不到这一点,或者即使意识到这一点,也找不到日志存放位置,希望本文对初学者有帮助。

转载自董的博客

本文链接地址: http://dongxicheng.org/mapreduce-nextgen/hadoop-logs-placement/

作者:Dong,作者介绍:http://dongxicheng.org/about/

本博客的文章集合:http://dongxicheng.org/recommend/

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 2. Hadoop 2.x版本 Hadoop 2.x中YARN系统的服务日志包括ResourceManager日志...
    sleepySnail阅读 370评论 0 0
  • 严歌苓作为中国当代著名的小说家,拥有着庞大的文学作品数量和深厚的文字功底,最为人熟知的作品《小姨多鹤》、《扶桑》等...
    张鲨鲨阅读 5,709评论 0 2
  • 跟着感觉走
    Anne11阅读 167评论 0 0
  • 时间如流水,匆匆而过。人们总是在最美好的年华不懂得珍惜,等到知道失去的可贵性,才知道,原来一切都已回不去,唯一留下...
    财神爷的小弟阅读 1,075评论 11 31
  • 对这座与自己从未疏离的小城平定,情感上的认同没有一见钟情,而是曾历经岁月漫长的磨砺。 这座春秋战国筑就、已超千岁的...
    安宿阅读 156评论 3 2