前言
国庆长假,本想专心给自己充充电,学习些其它感兴趣的知识,我有一个梦想是有朝一日能自己看懂日本的电视剧,就是台词很少,动作戏份又特别的多的那种。未曾想到老板对我的照顾与关怀超过了预期,在通讯软件上扔给我一个excel文档,让我按要求做填空题。
需求
- 统计所有服务器的IP地址及其归属地;
- 收集每台服务器的设备ID(从一个配置文件中读取);
- 统计每台服务器的数据盘总容量(以Gbyte为单位);
- 以“IP”、“设备ID”、“IP地址归属”、“磁盘容量”4列形成一个excel文档。
实现思路
收集设备ID
从易到难,最简单的就是收集服务器的设备ID了,命令如下:
#在shell文件里执行linux命令需要加上``,通过cat命令将deviceid文件的内容读取出来并赋给deivceID变量
deviceID=`cat /xxx/xxx/deviceid`
统计数据盘总容量,以Gbyte为单位
接下来是统计数据盘的总容量,方法如下:
#sum变量用于存储磁盘的容量值
sum=0
#这是一个for循环,我们拆解开来看。
#df | grep ssd | awk -F ' ' {'print $2 / 1024 / 1024'} | awk -F '.' {'print $1'}
#df命令能够列出所有已在系统上挂载的磁盘信息,grep ssd是我管理的系统映射的磁盘都取名为ssd,比如ssdA,ssdB,因为我只要数据盘,不需要系统盘的数据,所以要加上grep ssd。
#awk -F ' ' {'print $2 / 1024 / 1024'} ,以空格为分隔符,打印出第2列的信息(磁盘容量),但这个容量是以kbyte计算的,所以要除以2个1024将单位换算为Gbyte。
#awk -F '.' {'print $1'},因为换算后有小数点,我就再一次以"."为分隔符,只取整数部分
for disk in `df | grep ssd | awk -F ' ' {'print $2 / 1024 / 1024'} | awk -F '.' {'print $1'}`
do
#将df命令获取到的输出信息赋给disk,然后通过循环累加每块disk的容量。
sum=$[sum+disk]
done
收集服务器的IP地址及其归属信息
主要的麻烦点就是IP的归属信息查询,但我总不能100台服务器挨着1个1个的到网站上查吧,这不是我这种懒人会做的事情。
我需要找到一个提供IP归属的网站,并且支持以IP为参数提交数据,并能够将结果以文本方式返回。
经过一番搜索,我发现ip.cn这个网站符合我的要求。
这个返回结果正是我想要的,只是信息还需要进行加工,具体获取方式如下:
#第一步是获取本机的IP地址,这里我使用了ip route命令获取。
ip=`ip route | grep src | awk -F ' ' {'print $9'}`
#使用curl命令模拟发送Http请求,-s的意思是silent,不要获取额外的信息。
#注意观看上面的返回结果,其信息以“:”分隔(注意是中文的冒号),我要的是第2个冒号后的信息,即“北京市 联通”,所以取的第三列$3
ipaddr=`curl -s "https://ip.cn/index.php?ip=$ip" | awk -F ':' {'print $3'}`
好,IP归属也解决了,只剩下最后一个,如何将信息导出为csv格式方便excel打开。
将信息导出为csv格式
首先我们输出内容的时候就要控制好格式
#echo命令加-e参数表示支持控制附,就是最后的\n,每个变量之间用tab间隔开,这点很重要
echo -e "$ip $deviceID $ipaddr $sum\n"
以下是shell文件的完整代码:
#!/bin/bash
sum=0
for disk in `df | grep ssd | awk -F ' ' {'print $2 / 1024 / 1024'} | awk -F '.' {'print $1'}`
do
sum=$[sum+disk]
done
ip=`ip route | grep src | awk -F ' ' {'print $9'}`
ipaddr=`curl -s "https://ip.cn/index.php?ip=$ip" | awk -F ':' {'print $3'}`
deviceID=`cat /opt/soft/dcache/deviceid`
echo -e "$ip $deviceID $ipaddr $sum\n"
有了这个代码还不行,我们需要一种方式分别采集这100台服务器的信息并进行汇总。简而言之,要在100台服务器上执行写好的脚本,并把结果统一输出到文件中。
如果你看过我以前的一篇文章Ansible,运维人员的好助手,那就简单了。Ansible是一款linux下的开源自动化运维工具,它最大的特点就是无部署客户端就可以在目标机上进行指令操作。
首先我们利用ansible将写好的脚本拷贝到100台目标服务器上
#centos7是我自己取的组名,-m copy表示使用copy模块,-a是参数。
#src是源路径,dest是目标路径,force表示如果目标机有同名文件,覆盖执行
ansible centos7 -m copy -a "src=countInfo.sh dest=/root/countInfo.sh force=yes"
一条命令就将100台服务器部署上了想要运行的脚本,的确是我等懒人的福音。
接下来,我们要在100台服务上批量执行这个脚本。
# -m shell意思是使用ansible提供的shell模块,-a是参数
#grep -v 是去掉额外的信息
# > my.csv是将屏幕输出的信息导出到my.csv文件中
ansible centos7 -m shell -a "sh countInfo.sh"|grep -v 'rc=' > my.csv
执行后的结果如下
这里我只用1台服务器举例,我们看到目标机给我们返回了IP、归属地、磁盘容量等信息。
在正常情况下,执行完命令后,所有的信息均保存在my.csv文件中,但这个时候还不是真正的csv支持的格式,我们还有最后一步要走。
#使用sed命令,将文件中的所有tab控制符替换为“,”号,这也就是为何前面要求echo输出文件内容时要使用tab来分隔每列的原因。
sed -e 's/\t/,/g' my.csv > finish.csv
如此操作以后,生成了最终的finish.csv,可以直接用excel打开它了。但注意标题行要自己加上,生成的只有数据行。
补充一点,如果你是在mac下进行的操作(笔者就是),finish.csv里面的中文可能会是乱码,此时需要执行一条命令就可以正常显示中文了。主要的原因是mac下的excel读取utf8有点小问题。
#使用sed命令,将文件中的所有tab控制符替换为“,”号,这也就是为何前面要求echo输出文件内容时要使用tab来分隔每列的原因。
sed -e 's/\t/,/g' my.csv > finish.csv
补充一点,如果你是在mac下进行的操作(笔者就是),finish.csv里面的中文可能会是乱码,此时需要执行一条命令就可以正常显示中文了。主要的原因是mac下的excel读取utf8有点小问题。
iconv -f UTF8 -t GB18030 源文件.csv >新文件.csv
最后
老板让我7号交差,估计他也知道工作量巨大(当然是不用脚本的情况下),但岂知懒人为了更好的懒而迸发出来的动力是无穷的。
美好的国庆节就快结束,希望大家也分享一下你是怎么消费的国庆大假呢?