Hadoop测试使用

通过一个 MapReduce 程序测试 Hadoop，统计 HDFS 中/input/data.txt 文件内单词出现的次数。

（1）在 Ubuntu 操作系统的~目录下，创建一个文本文件 data.txt。

$ vi data.txt

在 data.txt 文件中输入如下内容，保存并退出。

Hello World

Hello Hadoop

$ hdfs dfs -mkdir /input

$ hdfs dfs -put data.txt /input

$ hdfs dfs -ls /input

$ cd ~/hadoop/share/hadoop/mapreduce

$ hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input/data.txt /output

$ hdfs dfs -cat /output/part-r-00000

stop-all.sh

Hadoop从入门到精通3：Hadoop2.x环境搭建之全分布模式
Hadoop的全分布模式最少需要三台机器：一台主节点，两台从节点。全分布模式主要用于生产环境。本节将来介绍一下Ha...
金字塔下的小蜗牛阅读 697评论 0赞 1
Hadoop从入门到精通2：Hadoop2.x环境搭建之伪分布模式
Hadoop的伪分布模式是在一台机器上模拟全分布模式包括HDFS在内的全部功能，一般用于开发测试Hadoop程序。...
金字塔下的小蜗牛阅读 552评论 0赞 1
Hadoop安装之二：使用Docker搭建Hadoop集群
（搭建集群部分借鉴了kiwenlau/hadoop-cluster-docker中的内容，不过那里的基础环境是Ub...
ProteanBear阅读 3,909评论 0赞 12
Hadoop从入门到精通6：Hadoop原理之MapReduce编程模型
前面我们介绍了Hadoop的分布式文件系统HDFS，解决的是大数据的存储问题。那么，对于HDFS上的存储的海量数据...
金字塔下的小蜗牛阅读 529评论 0赞 0
搭建Hadoop的环境
安装Hadoop环境之前需要做一些准备工作，比如：安装Linux、JDK、关闭防火墙、配置主机名、配置免密码登录、...
猿分享阅读 562评论 0赞 0

1赞2赞

赞赏

手机看全文