登录注册写文章

时序图解析Hadoop HDFS 文件读取访问流程（未完待续）

耗子在简书

时序图解析Hadoop HDFS 文件读取访问流程（未完待续）

最近有一个优化HDFS读取访问的需求，需要根据访问者的位置计算得到最佳的datanode返回给client，工作中，搜索了各种文章和材料，但是几乎没有太深入的，对我这个初学者来说，信息量不大够，所以就自己动手深入的看了一下源码，对相关的机制进行了一定的探索。根据自己的体会写一点心得，文中部分术语不够准确的希望能够留言予以指正。

HDFS文件访问的机制

无论那种情形（CLI、Java、REST...），HDFS文件系统最终都是通过在节点上的HDFS Client来实现对文件的访问，在逻辑上来讲，是这样的：

client

在实际的物理拓扑中，是这样的：

JAVA API client

javaclient
REST API client

REST

担负着Client角色的是org.apache.hadoop.hdfs.DFSClient这个类，它提供了一系列访问HDFS的接口和工具。
第一幅图是我手动画的，为了熟悉ubuntu下的dia绘图工具，加上删选和操作关联比较紧密的类，前后花了将近4个小时。。。第二幅图是用eclipse的插件Objectaid辅助生成的，手动调整了个别的函数调用，虽然这厮功能强大，但是也有不够完善的地方，不过瑕不掩瑜，毕竟比dia方便很多。
Java API 方式文件读取时序图一（Using dia）：

Hadoop HDFS open文件操作时序图

Java API 方式文件读取时序图二（Using Objecaid for eclipse）：

Java API sequence

webHDFS Client get操作时序图（Using Objecaid for eclipse）：

REST sequence

待续

最后编辑于：2017.12.07 15:12:55

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

史上最全，100+大数据开源处理工具汇总
http://geek.csdn.net/news/detail/210469http://www.36dsj.c...
Albert陈凯阅读 5,670评论 1赞 21
快速的部署Hadoop,Hbase和Hive
之前的有点忘记了,这里在云笔记拿出来再玩玩.看不懂的可以留言大家可以尝试下Ambari来配置Hadoop的相关环...
HT_Jonson阅读 3,228评论 0赞 50

第3章:Hadoop分布式文件系统(1)
当数据量增大到超出了单个物理计算机存储容量时，有必要把它分开存储在多个不同的计算机中。那些管理存储在多个网络互连的...
单行线的旋律阅读 2,091评论 0赞 7
Hadoop源码学习笔记(2)--Hdfs的启动流程分析
Hdfs 的基础架构如上图所示。默认情况下，Hdfs 由一个 Namenode 和多个 DataNode 组成...
kifile阅读 4,168评论 0赞 10
flexbox布局和属性
React Native的FlexBox布局 flexbox：弹性的相对布局三个关键字 flexDirection...
geekAppke阅读 647评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文