centos安装hadoop

1)如果系统已经安装java,通过以下方式设置java相关环境变量:

$ ls -lrt /usr/bin/java
lrwxrwxrwx. 1 root root 22 Mar 20 14:49 /usr/bin/java -> /etc/alternatives/java
$ ls -lrt  /etc/alternatives/java
lrwxrwxrwx. 1 root root 73 Mar 20 14:49 /etc/alternatives/java -> /usr/lib/jvm/java-1.8.0-openjdk-1.8.0.161-0.b14.el7_4.x86_64/jre/bin/java

设置java相关环境变量:

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.161-0.b14.el7_4.x86_64
export JRE_HOME=$JAVA_HOME/jre
export PATH=$JAVA_HOME/bin:$PATH

如果系统没有安装java,下载相应java版本进行安装,然后设置java相关环境变量即可。

2)设置ssh免登录

$ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
$ chmod 0600 ~/.ssh/authorized_keys

3)以伪分布式模式安装hadoop-2.7.6

从官方网站下载hadoop 2.7.6:https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.6/hadoop-2.7.6.tar.gz

将hadoop-2.7.6.tar.gz文件拷贝到/usr/local目录并解压,然后设置相关的环境变量:

export HADOOP_HOME=/usr/local/hadoop-2.7.6
export PATH=$HADOOP_HOME/bin:$PATH

进入/usr/local/hadoop-2.7.6/etc目录,依次修改以下配置文件:

  • core-site.xml
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>
  • hdfs-site.xml
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

格式化hdfs文件系统:

$ hdfs namenode -format

启动hdfs:

$ /usr/local/hadoop-2.7.6/sbin/start-dfs.sh

在浏览器输入:http://localhost:50070/,可以看到NameNode的相关信息。

4)运行示例程序

在hdfs上创建相应目录,并上传相应的文件到该目录:

$ cat log
hello hadoop
hello hdfs
hello mapreduce
$ hdfs dfs -mkdir -p /user/root/input
$ hdfs dfs -put log input
$ hdfs dfs -ls /user/root/input
Found 1 items
-rw-r--r--   1 root supergroup         40 2018-07-23 06:33 /user/root/input/log

运行示例程序:

$ hadoop jar /usr/local/hadoop-2.7.6/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar grep input output 'he[a-z.]+'

查看运行结果:

$ hdfs dfs -cat output/*
3   hello

参考:

https://hadoop.apache.org/docs/r2.7.6/hadoop-project-dist/hadoop-common/SingleCluster.html#Pseudo-Distributed_Operation

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 终极算法 关注微信号每天收听我们的消息终极算法为您推送精品阅读 前言 Hadoop 在大数据技术体系中的地位至关...
    Yespon阅读 130,327评论 12 168
  • hadoop依赖1.7+的jdk 如果是3.0+版本的hadoop依赖1.8+的idk,安装jdk 配置SSH 配...
    Garwer阅读 719评论 0 2
  • 一、系统参数配置优化 1、系统内核参数优化配置 修改文件/etc/sysctl.conf,添加如下配置,然后执行s...
    张伟科阅读 3,782评论 0 14
  • 前阵子看过一篇报道;说有所小学老师为了让学生有更好的成绩,利用午休时间给学生辅导作业;因为一个孩子潦草,在批评教育...
    唐人生阅读 435评论 0 1
  • 我现在23岁,在外边上学,时常会想起刚上大学的时候爸爸给我写的一封信,5、6年过去了,再次看起时还是会无限感慨,有...
    市民邢女士阅读 204评论 0 1