Hadoop初始化和测试

  • Hadoop添加环境变量
image.png
image.png
  • 初始化文件系统
    类似于第一次使用优盘的时候,需要格式化。

输入命令

image.png

出现如下即成功格式化


image.png
  • 启动Hadoop
image.png

经过三四次输入yes,密码后。。。。
如果成功


image.png

ResourceManager:资源管理进程,是yarn的老大。
NodeManager:yarn里面的小组长
NameNode:HDFS的老大。伪分布式中就有一个。集群中肯定有多个,为了安全
DataNode:HDFS的小弟,负责存放数据的仓库
SecondaryNameNode:是NameNode的助理,主要用来同步元数据。但是并不是NameNode的热备。只有在hadoop1和hadoop2的伪分布式才有。

  • web查看相应状态

    • HDFS管理界面


    • yarn管理界面
image.png
  • 测试hdfs
    • 上传文件到hdfs


image.png
  • 下载数据
image.png
  • wordcount例子
    数据输入和输出都是在hdfs中的
image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容