- Hadoop添加环境变量
- 初始化文件系统
类似于第一次使用优盘的时候,需要格式化。
输入命令
出现如下即成功格式化
- 启动Hadoop
经过三四次输入yes,密码后。。。。
如果成功
ResourceManager:资源管理进程,是yarn的老大。
NodeManager:yarn里面的小组长
NameNode:HDFS的老大。伪分布式中就有一个。集群中肯定有多个,为了安全
DataNode:HDFS的小弟,负责存放数据的仓库
SecondaryNameNode:是NameNode的助理,主要用来同步元数据。但是并不是NameNode的热备。只有在hadoop1和hadoop2的伪分布式才有。
-
web查看相应状态
-
HDFS管理界面
- yarn管理界面
-
- 测试hdfs
-
上传文件到hdfs
-
- 下载数据
- wordcount例子
数据输入和输出都是在hdfs中的