前言
《Ubuntu系统批量自动安装》一文中,配置好了PXE服务器,也通过它安装了几台机器。每个机器都重新配置好了IP,已经可以远程访问了。现在新的问题来了,每个机器的主机名都相同,需要修改;每个机器的sources.list都有问题,需要替换。以后,肯定也有很多其他需要批量操作的问题,比如批量安装ganglia,总不能上百台机器一个个手动操作吧!
本文,就研究下linux批量操作的相关方法和工具,重点研究下pssh。
批量操作思路
首先定义两个概念:管理机和客户机,本文中的管理机是指管理其他服务器的服务器,客户机是指普通服务器。
管理机IP为192.168.56.101,客户机IP为192.168.56.102-104,用户名都是test。
思路一
说到批量操作,最容易想到的,肯定是在管理机写一个脚本,里面有个循环语句,挨个连接客户机进行操作。
而循环语句里面,主要是ssh
,然后执行交互命令。参考 shell实现SSH自动登陆 、 关于SSH 远程执行命令你要知道的二三事 和 shell脚本实现同时多台远程主机执行命令的代码分享。
但是,这种方式很难并行处理,比较浪费时间。
思路二
另一个简单的思路,是在管理机写一个在客户机执行的脚本,然后推送给客户机,再在客户机里执行脚本。主要参考SSH 远程执行任务。
这种方式同样很难并行处理,比较浪费时间。如果非要并行处理,那么就只能牺牲反馈信息。
思路三
最后一种思路就是借助工具,比如mussh、pdsh、pssh等等。
pssh
pssh简介
pssh是一个python编写可以在多台服务器上执行命令的工具,同时支持拷贝文件,是同类工具中很出色的。类似pdsh,但是相对pdsh更为简便,使用前必须在各个服务器上配置好密钥认证访问。参考pssh命令和pssh HOWTO。
安装
1、ubuntu安装pssh,sudo apt-get install pssh
2、ubuntu安装完pssh后,输入pssh
,也许会提示:No command 'pssh' found, did you mean:...
解决办法参考Why pssh command is not working?,一条命令解决:
echo "alias pssh=parallel-ssh" >> ~/.bashrc && . ~/.bashrc
,其中&& . ~/.bashrc
代表立即生效。
3、设置相关命令
安装完pssh后,实际上还安装了pscp、prsync、pnuke和pslurp。和pssh命令无效的问题相同,它们默认也只能使用全名,不能只用简称。需要执行如下命令:
echo "alias pscp=parallel-scp" >> ~/.bashrc && . ~/.bashrc
echo "alias prsync=parallel-rsync" >> ~/.bashrc && . ~/.bashrc
echo "alias pnuke=parallel-nuke" >> ~/.bashrc && . ~/.bashrc
echo "alias pslurp=parallel-slurp" >> ~/.bashrc && . ~/.bashrc
其中,pscp把文件并行地复制到多个客户机;prsync使用rsync协议从管理机同步到客户机;pslurp将文件从客户机复制到管理机;pnuke并行地在客户机杀进程。
命令格式
命令格式:pssh [OPTIONS] command [...]
选项:
--version:查看版本
--help:查看帮助,即此信息
-h:主机文件列表,内容格式"[user@]host[:port]"
-H:主机字符串,内容格式"[user@]host[:port]"
-l:登录使用的用户名
-p:并发的线程数【可选】
-o:输出的文件目录【可选】
-e:错误输入文件【可选】
-t:TIMEOUT 超时时间设置,0无限制【可选】
-O:SSH的选项
-v:详细模式
-A:手动输入密码模式
-x:额外的命令行参数使用空白符号,引号,反斜线处理
-X:额外的命令行参数,单个参数模式,同-x
-i:每个服务器内部处理信息输出
-P:打印出服务器返回信息
实践篇
添加密钥认证访问
参考Linux之SSH密钥认证和ssh使用密钥进行认证,在管理机上制作密钥对,将公钥添加给客户机,然后通过ssh免密登录。
1、确认管理机和客户机都安装了ssh。
ps aux | grep ssh
2、在管理机上创建密钥对
ssh-keygen
所有的提示按enter键即可,完成后在home目录执行ll .ssh
,即可看到创建好的id_rsa和id_rsa.pub文件。
3、把公钥拷贝到所有客户机中
ssh-copy-id -i .ssh/id_rsa.pub -p 22 test@192.168.56.102
4、测试登录
上一步拷贝完成后,会提示使用ssh -p '22' 'test@192.168.56.102'
测试登录。
在管理机中,使用ssh test@192.168.56.102
测试登录,我们发现已经不需要输入密码了。
5、查看公钥
登录102客户机,ll .ssh
,我们发现有一个authorized_keys文件,文件的内容和管理机的id_rsa.pub相同。
5、测试命令
ssh test@192.168.56.102 '/sbin/ifconfig'
返回了102客户机的ifconfig执行结果,测试成功。
6、设置sudo命令免密码
ssh test@192.168.56.102 'sudo iptables --list'
报错:sudo: no tty present and no askpass program specified
这个问题,需要在每个客户机下进行sudo免密设置。
进入客户机之后,sudo vim /etc/sudoers
,添加:
test ALL = NOPASSWD: ALL
再次执行ssh test@192.168.56.102 'sudo iptables --list'
,成功。
获取每台机器的uptime
1、在管理机上新建hosts.txt,内容为:
test@192.168.56.102
test@192.168.56.103
test@192.168.56.104
2、执行uptime
pssh -h hosts.txt -i uptime
3、保存执行结果
pssh -h hosts.txt -i -o /tmp/pssh/ uptime
ll /tmp/pssh
cat /tmp/pssh
批量修改hostname
参考Linux批量修改多台服务器的主机名(hostname),我们把客户机的主机名改为vk102、vk103和vk104。
1、新建hosts文件,内容为:
192.168.56.102 vk102
192.168.56.103 vk103
192.168.56.104 vk104
2、新建hostname.sh文件,内容为:
#!/bin/bash
ip=`ifconfig eth0 | grep 'inet' | awk '{print $2}' | tr -d 'addr:'`
hostname=`cat /home/test/hosts | grep $ip | awk '{print $2}'`
echo $ip
echo $hostname
hostnamectl set-hostname --static $hostname
hostname $hostname
3、发送到hosts和hostname.sh到客户机/home/test目录下
pscp -h hosts.txt ./hosts /home/test
pscp -h hosts.txt ./hostname.sh /home/test
4、批量授予hostname.sh可执行权限
pssh -h hosts.txt -i 'chmod +x /home/test/hostname.sh'
5、批量执行hostname.sh
pssh -h hosts.txt -i 'sudo sh /home/test/hostname.sh'
报错:Stderr: hostname: you must be root to change the host name
命令修改为:pssh -h hosts.txt -i 'sudo sh /home/test/hostname.sh'
执行成功。
批量替换sources.list
1、新建sources.list,内容为:
deb http://mirrors.aliyun.com/ubuntu/ trusty main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ trusty-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ trusty-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ trusty-proposed main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ trusty-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ trusty main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ trusty-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ trusty-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ trusty-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ trusty-backports main restricted universe multiverse
2、客户机备份原sources.list
pssh -h hosts.txt -i 'sudo mv /etc/apt/sources.list /etc/apt/sources.list.bak'
3、复制新的sources.list到客户机
pscp -h hosts.txt sources.list /home/test/
pssh -h hosts.txt 'sudo mv /home/test/sources.list /etc/apt/'
4、更新安装源
pssh -h hosts.txt -i 'sudo apt-get update'
批量安装ganglia
参考Ubuntu14.04安装配置Ganglia,假设我们已经配置好了ganglia主节点。
1、把ganglia主节点的/etc/ganglia/gmond.conf
文件拷贝到管理机当前目录。
2、编写ganglia安装脚本install-gmond.sh(不要照抄,下面有修改版)
#!/bin/bash
sudo apt-get -y install ganglia-monitor rrdtool && \
sudo mv /etc/ganglia/gmond.conf /etc/ganglia/gmond.conf.bak && \
sudo mv /home/test/gmond.conf /etc/ganglia/ && \
sudo /etc/init.d/ganglia-monitor restart && \
sudo rm -rf /home/test/install-gmond.sh
3、拷贝gmond.conf和install-gmond.sh到客户机
pscp -h hosts.txt gmond.conf /home/test/
pscp -h hosts.txt install-gmond.sh /home/test/
4、添加执行权限
pssh -h hosts.txt -i 'chmod +x /home/test/install-gmond.sh'
5、执行安装
pssh -h hosts.txt -i 'sudo apt-get update'
pssh -h hosts.txt -i 'sudo sh /home/test/install-gmond.sh'
脚本虽然顺利执行了,但是报错:Stderr: debconf: unable to initialize frontend: Dialog
解决办法是修改脚本为:
#!/bin/bash
export DEBIAN_FRONTEND=noninteractive DEBCONF_NONINTERACTIVE_SEEN=true && \
sudo apt-get -y -q install ganglia-monitor rrdtool && \
sudo mv /etc/ganglia/gmond.conf /etc/ganglia/gmond.conf.bak && \
sudo mv /home/test/gmond.conf /etc/ganglia/ && \
sudo /etc/init.d/ganglia-monitor restart && \
sudo rm -rf /home/test/install-gmond.sh
6、查看运行状态
pssh -h hosts.txt -i -o /tmp/pssh/ 'ps aux | grep ganglia'
批量修改密码
参考shell实现SSH自动登陆 和 6个Expect脚本示例,使用expect命令。
1、管理机上新建chpasswd.sh脚本,内容如下:
#!/usr/bin/expect
set timeout 3
set user test
set password 123456
spawn sudo passwd $user
expect "Enter new UNIX password:"
send "${password}\r"
expect "Retype new UNIX password:"
send "${password}\r"
expect eof
2、在客户机上安装expect(可以用whereis expect
查看是否安装)
pssh -h hosts.txt -i 'sudo apt-get install expect -y'
3、拷贝chpasswd.sh脚本到客户机
pscp -h hosts.txt chpasswd.sh /home/test
5、添加执行权限
pssh -h hosts.txt -i 'sudo chmod a+x /home/test/chpasswd.sh'
5、执行修改密码
pssh -h hosts.txt -i 'sudo /home/test/chpasswd.sh'
6、删除chpasswd.sh脚本
pssh -h hosts.txt -i 'sudo rm -rf /home/test/chpasswd.sh'
批量杀进程
假设需要杀死的进程为gmond。
方法一:
pnuke -h hosts.txt gmond
pssh -h hosts.txt -i 'ps -ef | grep gmond'
这种方法虽然显示success,但是查看进程依然存在,看来存在不确定性。猜测对于sudo启动的进程难以杀死。
方法二:
pssh -h hosts.txt -i 'sudo pkill -9 gmond'
这种方法杀的很彻底,是个好方法。
方法三:
pssh -h hosts.txt 'sudo ps -ef | grep gmond | awk '{print $2}' | xargs kill -9'
这种方法也显示success,但是查看进程依然存在,还是有问题。猜测因为sudo作用在了ps上,所以对于sudo启动的进程难以杀死。
方法四:
pssh -h hosts.txt -i 'sudo kill -s 9 `pgrep gmond`'
这种方法杀的很彻底,是个好方法。
PS:启动gmond命令pssh -h hosts.txt -i 'sudo /etc/init.d/ganglia-monitor start
后记
以上实践,已经包含了pssh的最常见用法。更高级的用法,就在需要时再去学习吧!