Cloudera大数据平台环境搭建

Cloudera大数据平台环境搭建

1、Hadoop简绍


1)Hadoop 是一个由Apache基金会所开发的分布式系统基础架构。

2)主要解决,海量数据的存储和海量数据的分析计算问题。

3)Hadoop通常是指一个更广泛的概念,Hadoop生态圈。



1.2 CDH简绍



        目前Hadoop比较流行的主要有2个版本,Apache和Cloudera版本。

         Apache Hadoop:维护人员比较多,更新频率比较快,但是稳定性比较差。

         ClouderaHadoop(CDH):CDH:Cloudera公司的发行版本,基于ApacheHadoop的二次开发, 优化了组件兼容和交互接口、简化安装配置、增加Cloudera兼容特性。

            简单来说:CDH 是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件),使得集群的安装可以从几天的时间缩短为几个小时,运维人数也会从数十人降低到几个人,极大的提高了集群管理的效率。


    CDH安装完成后,系统主界面,了解大数据,就从搭建大数据平台开始吧,让技术不再难而却步,大数据底层组件不再陌生,亲手搭建,成功就在眼前。
    


2.Cloudera大数据平台环境搭建

        大数据平台的搭建,需要了解linux命令、基本的Hadoop组件知识,同时需要掌握一套清晰的搭建系统的流程,而这些知识的综合,把大多数人就挡在门槛之外,为了学习和了解大数据底层知识的人员,我们特提供一套详细搭建过程,便于跨过这个门槛。

     平台搭建步骤图:


2.1系统准备

通过win10远程登录到虚拟机环境操作相应业务流程,需在win10环境安装相应的工具。

1)本机环境为win10环境,通过搭建虚拟机-linux系统来搭建大数据环境,

 安装WinScp文件传输工具,传输相应的安装文件到linux系统。 WinSCP是一个Windows环境下使用SSH的开源图形化SFTP客户端。它的主要功能就是在本地与远程计算机间安全的复制文件。链接linux系统等。


2)安装Xshell远程工具,通过远程命令行的方式操作linux系统,不用频繁切换linux系统。

    Xshell 是一个强大的安全终端模拟软件,支撑Microsoft Windows 平台的TELNET 协议。通过互联网到远程主机的安全连接以及它创新性的设计和特色帮助用户在复杂的网络环境中进行工作。


3)虚拟机VMware 15,安装centos7系统构建大数据环境,3台虚拟机以上,VM12以上版本支持linux图形界面。




2.2平台规划

        平台规划:本次规划为3台服务器组建集群环境;

          其中一台主机,另外2台代理,主机作为主控服务器,相应内存大点,另外2台主做存储和 计算。

          内存大小分配会影响后续CDH图表页面的显示。




2.3系统环境



2.3.2 修改机器名称



2.3.3防火墙设置中


2.3.4免密登录设置

设置免密钥登录:不录入密码条件下,可由主机自动登录到其它agent机器,便于后续主机进行文件分发。具体参考:https://www.jb51.net/article/107955.htm

1、所有机器:vi /etc/ssh/sshd_config

  RSAAuthentication yes

  PubkeyAuthentication yes

  PermitRootLogin yes

2、所有机器都执行命令:ssh-keygen -t rsa,生成 key,一律不输入密码,直接回车,/root 就会生成

.ssh 文件夹。

3、主服务器

  cd /root/.ssh

  catid_rsa.pub>>authorized_keys

  sshroot@192.168.137.102 cat ~/.ssh/id_rsa.pub>> authorized_keys

  sshroot@192.168.137.103 cat ~/.ssh/id_rsa.pub>> authorized_keys

  scpauthorized_keys root@192.168.137.102:/root/.ssh/

  scpauthorized_keys root@192.168.137.103:/root/.ssh/

  scpknown_hostsroot@192.168.137.102:/root/.ssh/

  scpknown_hostsroot@192.168.137.103:/root/.ssh/

4、在主服务登录:ssh

root@192.168.137.102


2.3.5selinux关闭:

  所有服务器都要设置。


2.3.6  安装配置ntpd服务


安装配置ntpd服务:

  所有服务器都要设置,  由于本人采用简单方式,没有按照网上查询文档进行安装设置

      查询相关文档https://www.bbsmax.com/A/A7zgmwB154/



2.3.7 系统参数

已启用透明大页面压缩,可能会导致重大性能问题。请运行:

echo 10 > /proc/sys/vm/swappiness

echo 'vm.swappiness=10'>> /etc/sysctl.conf

echo 'echo

never > /sys/kernel/mm/transparent_hugepage/defrag' >> /etc/rc.local

echo 'echo

never > /sys/kernel/mm/transparent_hugepage/enabled' >> /etc/rc.local




2.4数据库环境

      本节主要统一介绍与数据库相关组件的安装,便于统一规划,因为这些组件在安装、应用过程中都有关联,这节配置基本与后续的数据库配置页面相关,随后再提,现在有个准备,保留。


2.4.1JDK


2.4.2 ,mysql安装




在命令行下执行,创建相应数据库:

  create database hive DEFAULT CHARACTER

SET utf8;

  createdatabaserman DEFAULT CHARACTER SET utf8;

  createdatabaseamon DEFAULT CHARACTER SET utf8;

  createdatabaseoozie DEFAULT CHARACTER SET utf8;

  createdatabase hue DEFAULT CHARACTER SET utf8;

  createdatabase monitor DEFAULT CHARACTER SET utf8;

  createdatabase reports DEFAULT CHARACTER SET utf8;

  createdatabasenavigatoraudit DEFAULT CHARACTER SET utf8;

  createdatabasenavigatormetadata DEFAULT CHARACTER SET utf8;

  flushprivileges;

          exit;


2.5CM安装

      Cloudera Manager(简称CM)是Cloudera公司开发的一款大数据集群安装部署利器,这款利器具有集群自动化安装、中心化管理、集群监控、报警等功能,使得安装集群从几天的时间缩短在几小时以内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。


2.5.1安装包下载

安装包下载:

wget http://archive.cloudera.com/cm5/cm/5/cloudera-manager-centos7-cm5.13.1_x86_64.tar.gz

wget  http://archive.cloudera.com/cdh5/parcels/5.13.1/manifest.json

wget http://archive.cloudera.com/cdh5/parcels/5.13.1/CDH-5.13.1-1.cdh5.13.1.p0.2-el7.parcel

wge thttp://archive.cloudera.com/cdh5/parcels/5.13.1/CDH-5.13.1-1.cdh5.13.1.p0.2-el7.parcel.sha1

统一下载到:cd /root/Downloads/

建立文件夹

mkdir  /opt/

1)在主服务器,根目录,

      mkdir -p

    /opt/cloudera/parcel-repo

     chown cloudera-scm:cloudera-scm/opt/cloudera/parcel-repo

2)在所有的节点上创建parcels目录,操作如下:

     mkdir -p

      /opt/cloudera/parcels

      chown cloudera-scm:cloudera-scm /opt/cloudera/parcels 

2.5.2创建用户

所有服务器

useradd --system

--home=/opt/cm-5.13.1/run/cloudera-scm-server/  --shell=/bin/false --comment "Cloudera SCM

User" cloudera-scm

2.5.3制作本地yum源

1)制造本地YUN源,配置主节点仓库目录

cd  /root/Downloads/

cp CDH-5.13.1-1.cdh5.13.1.p0.2-el7.parcel

CDH-5.13.1-1.cdh5.13.1.p0.2-el7.parcel.sha1   manifest.json     /opt/cloudera/parcel-repo/

cd  /opt/cloudera/parcel-repo

mv  CDH-5.13.1-1.cdh5.13.1.p0.2-el7.parcel.sha1

  CDH-5.13.1-1.cdh5.13.1.p0.2-el7.parcel.sha

2)安装CM

cd /root/Downloads/

tar -zxvf

cloudera-manager-centos7-cm5.13.1_x86_64.tar -C /opt/

3)分发包

将cm-5.13.1

打包,并复制到其他服务器

cd /opt

tar czfcm-5.13.1.tar.gz  cm-5.13.1/

//复制到其他节点

scp  cm-5.13.1.tar.gz  root@CM5-02:/opt/

scp  cm-5.13.1.tar.gz  root@CM5-03:/opt/

其它节点,//将cm-5.13.1

包解压

cd /opt

tar -xzvf cm-5.13.1.tar.gz

2.5.4 启动CM服务

启动主节点

  /opt/cm-5.13.1/etc/init.d/cloudera-scm-server

start   /opt/cm-5.13.1/etc/init.d/cloudera-scm-server

restart  /opt/cm-5.13.1/etc/init.d/cloudera-scm-server

stop  在所有节点上启动agent:

  /opt/cm-5.13.1/etc/init.d/cloudera-scm-agent

start   /opt/cm-5.13.1/etc/init.d/cloudera-scm-agent

restart   /opt/cm-5.13.1/etc/init.d/cloudera-scm-agent

stop 

查询启动日志

tail -f  /opt/cm-5.13.1/log/cloudera-scm-server/cloudera-scm-server.log

curl  -i 192.168.137.100:7180/cmf/login

登录网址http://192.168.137.101:7180/


2.6 CDH安装及配置









最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容