python使用hdfs包远程上传文件出错原因及解决措施

错误提示

ConnectionError: HTTPConnectionPool(host='slave2', port=50075):Max retries exceeded with url: /webhdfs/v1/home/temp/temp1/test.py?op=OPEN&user.name=root&namenoderpcaddress=master:9000&offset=0 (Caused by NewConnectionError(': Failed to establish a new connection: [Errno -2] Name or service not known',))

原因分析

报错的重点在于,Max retries exceeded with url 和 Name or service not known达到最大尝试次数后,提示未知的地址或服务,说明客户端并没有与数据节点建立连接。

根据hdfs读流程的数据流向可以看到,当主节点确认hdfs中存在被请求的数据时,客户端时直接与子节点建立连接的,而在某个特定情况下,子节点和客户端可能不在同一网段,或者客户端/etc/host中没有记录子节点地址与机器名的映射,而导致连接失败。

解决措施

将客户端和所有节点放到同一网段,如果已经在同一网段,可以尝试在客户端/etc/host中添加子节点地址与机器名的映射。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,923评论 18 139
  • 名词延伸 通俗的说,域名就相当于一个家庭的门牌号码,别人通过这个号码可以很容易的找到你。如果把IP地址比作一间房子...
    杨大虾阅读 20,634评论 2 56
  • 该文档是用Hbase默认配置文件生成的,文件源是Hbase-default.xml hbase.rootdir 这...
    我是嘻哈大哥阅读 4,811评论 0 7
  • 每个人都有每个人的界限,你说这叫尊重! 嗯,你说的对! 一个人孤单地生活在这个浩瀚的人世间,不错,没有人能真正走进...
    时光微扬阅读 208评论 0 0
  • 一夜无眠,精神不佳,枯燥乏味的培训,让人昏昏欲睡。今天没有回答问题。活动结束,获得了一个小狗和一个杯子。同事之间的...
    bbd77fe72ff7阅读 180评论 0 0