hadoop 新增datanode 扩容

image.png

我们的机器 由于 日志量大 又开始了扩容,hadoop 2.8 不支持 disk volume level rebalance ,hadoop 3.0支持,可是 我们安装的是2.8,所以只能通过添加新的数据节点来完成 数据容器的扩容和负载均衡。
首先 hadoop 是支持动态扩容,原来的NameNode 和DataNode都不需要停止服务,新的数据节点启动 DataNode 和NodeManager 两个后台进程后 就自动直接加入即可,当然这里面还是有一些学问的,需要你来自己配置,集群机器都部署在阿里云,以下为具体的操作步骤

1.首先 购买 机器和磁盘
4核8G 32T ,cpu和内存不大,硬盘很大,因为我们这次 最主要是为了装日志 装数据,这台机器 很贵,好几千呢

2.格式化 新机器 磁盘
十六块 磁盘,每块2T ,单单格式化磁盘就要很久
幸好我写了一个脚本,自动化完成格盘,不然 单单格式化磁盘,我就要吐血了,末尾张贴 脚本

3.新机器 配置 1.主机名 2 jdk 3 hadoop 4环境变量 5 host 和 6创建 hadoop 操作用户,要和原来集群的hadoop 操作用户是一致的,
hadoop的文件 建议直接把NameNode上的hadoop安装目录直接copy过来,这样原来的配置 就不需要重新配置了,jdk hadoop 和其他的和集群原先的保持 安装位置尽量一致,不然需要单独个性化配置,比较繁琐,注意一定要把 hadoop/log目录排除在外,第一 好几个月了 log真的很大数据量,我们的好像是8G 了,第二 真的没用,
新机器要把原来 集群上的ip 主机名 配置在自己的机器上的 /etc/hosts上,并把自己的 ip 主机名也配置在集群上原先的所有机器上

4.所有的 原来 集群集群 host 及hadoop slaves文件 添加 新机器 的主机名和内网地址

5.配置 NameNode 的hadoop操作用户免登陆到新机器
这个环节 其实是非常简单的,但是我已经载过三次跟头了,真是没头脑,这次要单独做一下 整理,白白浪费五六个小时,
比如 我要做的是 NameNode A 免登陆到DataNode B,我想让 A 的hadoop 操作用户 角色 hadoop_role 免登陆到 B上并以B上的hadoop操作用户 hadoop_role 登录
首先 在 A 机器上 切换到 hadoop_role 用户
然后执行 生成 ssh-key ,我们要注意的就是ssh-key 是和用户绑定的,
然后在 B机器上确认 在 /home/hadoop_role 目录下有隐藏目录 .ssh目录
然后在 A 机器下 把 A 的hadoop-role 目录下的author-key 传递到 B机器的 hadoop-role 目录 .ssh 目录下
这个时候可能需要确认 A B 两台机器上 ./ssh 目录 权限 和 author-key的权限,由于权限不足造成 ssh 无法登录的还是很多的
具体的就是

在管理节点上执行下面操作:

1.  sudo su hadoop
2.  ssh localhost
3.  [cd](http://3.cd/)

    ~/.ssh
4.  rm ./id_rsa*
5.  ssh-keygen -t rsa -P ""
6.  cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys [root]
6  cat  /home/hadoop/.ssh/id_rsa.pub  >>  /home/hadoop/.ssh/authorized_keys  
7.  把id_rsa.pub传输到数据节点hadoop用户下的.ssh目录中

其实我是传的 authorized_keys ,在 NameNode A上操作

scp  /home/hadoop/.ssh/authorized_keys   root@hadoop-data04:/home/hadoop/.ssh/authorized_keys  

在数据节点上执行下面操作:

1.  cat id_rsa.pub >> authorized_keys
2.  rm -rf id_rsa.pub
3.  chmod 600 authorized_keys

最后在管理节点上测试是否配置成功
基本上就可以 A 免登陆 B了
`
我这次就因为偷懒 错误 使用ssh-copy-id 命令
参考 http://man.linuxde.net/ssh-copy-id
正确操作是

  1. ssh-keygen -t rsa -P ""
    生成的公钥位置
    image.png

    2.ssh-copy-id 时一定要 指定公钥位置,不然就悲剧了,用 -i 指定
    比如是这样
    ssh-copy-id -i /root/.ssh/id_rsa.pub root@192.168.255.162 ,回车 会让输入 要登录机器 的该用户角色 的密码
    一次,然后退出后 ,下次就可以免密码登录了
    造成这个错误 ,耽搁太久,最终还把 B 机器的ssh 服务搞乱了 挂掉了,正常无法登录了,而且 ssh的配置文件也被篡改了,最后经过多方努力,通过阿里云的后台 远程连接到这台机器,修复了ssh配置文件,然后重启ssh服务,整好了
    image.png

_ssh 公钥认证报错:Permission denied (publickey,gssapi-keyex,gssapi-with-mic).解决](http://blog.csdn.net/wang_zhenwei/article/details/53105390)

6.在 新机器上 确认 hadoop 配置文件 中 hdfs-site.xml 中 数据存储是否需要修改增加 ,其他在配置文件中的 硬件 配置信息 是否要做修改,比如说 内存和 cpu 的核数 配置 hadoop 安装目录权限,另外就是 数据存储磁盘 的写入权限 ,之后 启动 DataNode 和NodeManager 后台进程,注意查看是否启动成功,启动失败则通过日志 出错信息 确认到底是什么造成失败

sbin/hadooo-daemon.sh start  datanode
sbin/yarn-daemon.sh start nodemanager  

jps

7.查看 hadoop的web ui 确认新机器是否已经加入到集群中来


image.png

8.之后执行 hadoop balancer
这个建议 后台执行 ,不然远程连接一断,这个就断了
而且要注意的是,这个balancer 是一个漫长的过程 ,你内网网络传输是最大的瓶颈,它有多大,极限就有多大,我们的内网传输也就 不到200m/s,所以 要balancer 18T 的数据真的 ,哎,好久好久

image.png

9.总结 教训
扩容是一个比较 有挑战的内容,可能会造成数据重复 丢失等情况
扩容 是一个细致的活儿,要注意到很多琐碎的事情
扩容最好 安排在晚上 或者周五,格式化硬盘和 rebalance是一个 相当耗时的,把耗时的内容尽量安排在 晚上或者业务空闲或者非工作时间
ssh key 免登陆 这个要好好整整,折腾了五六个小时 错误的,太耽误时间,了解一下ssh的原理是很必须的
hdfs 数据压缩归档一定要日常化,再大的盘也有满的时候
不要等hdfs 达到 90% 以后才开始 扩容,不然会影响 到数据流的写入和其他业务进程
数据流到hdfs的管道一定要正常化, 上来就压缩是最好的,
扩容rebalance时 数据可能无法正常写入 ,mapReduce job也可能无法进行,想想也是,数据存储位置在不断改变,
最重要的是 一定要早点【逼着】领导给你买机器扩容,不然 逼到临界点,写不进去数据才扩容,修补数据 就更烦人了
送你一句箴言 : 【 年轻人,删库 跑路是要 坐牢 滴 /手动微笑/ 】
格盘脚本

#!/bin/sh

disks=("/dev/vdb" "/dev/vdc"  "/dev/vdd" "/dev/vde" "/dev/vdf" "/dev/vdg"  "/dev/vdh" "/dev/vdi" "/dev/vdj" "/dev/vdk" "/dev/vdl" "/dev/vdm" "/dev/vdn" "/dev/vdo" "/dev/vdp" "/dev/vdq" )
counts=1

for  disk  in  ${disks[*]}
do
   echo "begin fenqu disk :"+ $disk
   echo "format disk complete  mkdir ing"+${counts}
   sudo -i mkdir /data${counts}
   echo "n
         p
         1


         wq"| fdisk $disk &
   echo "fenqu finish,format disk ing"
   mkfs.ext3 ${disk}1
   
   echo "register  in  fstab"
   echo  "${disk}1   /data${counts} ext3 defaults  0  0">> /etc/fstab
   echo "gua zai disk"
   
   echo "all complete"
   counts=$(expr $counts + 1)
   echo "counts"+$counts
   
done
mount -a

参考文献 :
https://www.cnblogs.com/fefjay/p/6048269.html

http://blog.csdn.net/lichangzai/article/details/19118711

后台启动 hadoop 的部分单独进程
http://blog.csdn.net/lazythinker/article/details/47836097

http://www.cnosx.com/2017/10/08/%E9%98%BF%E9%87%8C%E4%BA%91ECS%E5%85%AC%E5%8C%99%E6%97%A0%E6%B3%95%E7%99%BB%E9%99%86/

https://stackoverflow.com/questions/36300446/ssh-permission-denied-publickey-gssapi-with-mic

https://www.cnblogs.com/xubing-613/p/6844564.html

http://www.oschina.net/question/54100_28922

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,951评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,606评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,601评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,478评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,565评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,587评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,590评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,337评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,785评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,096评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,273评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,935评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,578评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,199评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,440评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,163评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,133评论 2 352

推荐阅读更多精彩内容