ansible-playbook第一次实战

背景

公司项目,32台云主机,部署公司服务,部署比较简单,把部署包上传然后解压并配置,获取机器信息并将机器信息文件发给同事进行授权,然后将授权文件放在指定目录,拉起完事。然后测测接口可用就行。
32台云主机,部署包倒是可以分发,但是一想到要在32台机器上执行『解压-->配置-->获取指纹信息-->下载指纹信息-->将获取到的license文件导入指定位置-->服务拉起-->验证接口』这流水线一般的操作,就头疼。

所以想到了俩种方式

  • 1> 可以用"ssh免密登录+脚本刷机"的方式来完成,好处是简单方便,坏处但是结果没有幂等性,如果脚本写的不到位,还得各种改。
  • 2> 用ansible的剧本跑一下,好处是执行结果具有幂等性,即使执行多遍结果相同,坏处是对ansible不熟悉,花费时间可能较长。(手动狗头)
    嗯,不过一想到有这么好的机会,不用ansible刷机可惜了。脚本什么时候都可以写,但是ansible使用的机会不多啊,所以觉得练练我的ansible剧本。

需求拆分

以上,需求已经大体描述过了,然后下面细化一下需求。

    1. 部署包分发问题
    1. 解压配置问题
    1. 配置主机名
    1. 获取机器信息
    1. 将获取到的信息收集到管理节点
    1. 将license分发到每个节点
    1. 统一拉起服务
    1. 测试接口是否可用
    1. 设置服务健康检查脚本并自动拉起

各个击破

    1. 部署包分发问题
    1. 解压配置问题

上面俩个问题可以借助云主机的特性来完成;
先申请一台云主机,然后将部署包上传,解压,配置(服务地址就用127.0.0.1就行,所以不需要写机器的IP,端口由于是新机器所以不存在占用),然后就是分发了,这里使用主机镜像,类似于KVM的克隆,将第一台云主机制作镜像,然后后面创建31台云主机时使用此镜像就OK(注意:制作镜像时只会保存系统盘下的数据,所以部署包要放在系统盘下面)。

    1. 配置主机名

这一步比较麻烦,为什么呢?因为如果是单独创建的云主机,创建时可以自定义主机名,但是批量创建时却没有定义主机名的地方,所以还需要自己配置。
具体需求是:

节点 IP hostname
节点1 172.16.0.6 kbj-001
节点2 172.16.0.7 kbj-002
... .. ...
节点32 172.16.0.37 kbj-032

如果用脚本
可以将IP的最后一段号码与主机名做对应,然后用for循环来做,如下

for i in `seq 7 37`;do
  IP="172.16.0.${i}"
  for j in ${IP};do
    ((i=i-5))
    if [ ${i} -lt 10 ];then
      ssh ${j} "hostnamectl set-hostname kbj-00${i}"
    elif [ ${i} -ge 10 ];then
      ssh ${j} "hostnamectl set-hostname kbj-0${i}"
    fi
  done
done

用ansible要怎么做呢

由于创建云主机时,用的是统一的root密码,所以使用ansible时就懒得做免密登录了,就在ansible的配置文件里定义了ansible_ssh_pass='*****',然后将配置文件里的host_key_checking = False打开。

  • ansible的主机清单如下:
# cat /etc/ansible/hosts
[master]
172.16.0.6  ansible_ssh_pass='****'
[kbj]
172.16.0.[7:9]
172.16.0.1[0:9]
172.16.0.2[0:9]
172.16.0.3[0:7]
[kbj:vars]
ansible_ssh_pass='****'
[all:children]
master
kbj
  • 设置hostname的playbook如下:
# cat set-hostname.yaml 
---
- hosts: all
  gather_facts: true
  tasks:
  - name: set hostname
    hostname: 'name={{ host_name }}'
  - name: "add line"
    lineinfile:
      dest: /etc/hosts
      line: "{{ ansible_all_ipv4_addresses[0] }} {{ host_name }}"

此时的问题是,这个host_name变量我应该怎么定义比较合适。最初想用loop循环来做,但是应了抖音那句话:『一看就会,一写就废』,买了本《ansible权威指南》,里面倒是有例子,官网loop模块也有例子,但看了好几遍都不知道改怎么写。
最后实在想不出来了,只能将hosts文件中的主机组单独列出来,并单独定义host_name变量,这样就可以用这个剧本了。如下

172.16.0.7   host_name=kbj-002
172.16.0.8   host_name=kbj-003
172.16.0.9   host_name=kbj-004
172.16.0.10  host_name=kbj-005
172.16.0.11  host_name=kbj-006
172.16.0.12  host_name=kbj-007
172.16.0.13  host_name=kbj-008
172.16.0.14  host_name=kbj-009
172.16.0.15  host_name=kbj-010
172.16.0.16  host_name=kbj-011
172.16.0.17  host_name=kbj-012
172.16.0.18  host_name=kbj-013
172.16.0.19  host_name=kbj-014
172.16.0.20  host_name=kbj-015
172.16.0.21  host_name=kbj-016
172.16.0.22  host_name=kbj-017
172.16.0.23  host_name=kbj-018
172.16.0.24  host_name=kbj-019
172.16.0.25  host_name=kbj-020
172.16.0.26  host_name=kbj-021
172.16.0.27  host_name=kbj-022
172.16.0.28  host_name=kbj-023
172.16.0.29  host_name=kbj-024
172.16.0.30  host_name=kbj-025
172.16.0.31  host_name=kbj-026
172.16.0.32  host_name=kbj-027
172.16.0.33  host_name=kbj-028
172.16.0.34  host_name=kbj-029
172.16.0.35  host_name=kbj-030
172.16.0.36  host_name=kbj-031
172.16.0.37  host_name=kbj-032

嗯,这里可以借助Excel,要不然手动复制粘贴再修改还是比较麻烦的。vim也可以做到,但是之前用的不多,还得查资料,没Excel来的快。本来想用精简的代码量来搞定这个问题,没想到还是被难住了,这还是30多台,要是300多台,恐怕就要废了。
PS:此处总结出一个道理,任何工具用得好的才是工具,如果要效率,还是用自己熟悉的工具比较靠谱(当然,练手除外,人总是要进步的,要不然容易被淘汰,尤其是互联网行业)

    1. 获取机器信息

这里需要执行一个脚本来获取硬件码,然后将获取到的results.txt文件发给RD来授权,使用下面playbook来做的

# cat test.yaml 
---
- hosts: all
  tasks:
  - name: stat /mnt/scriprtsh
    stat: path=/mnt/script.sh
    register: token_stat
  
  - name: add execute to script
    file:
      path: /mnt/script.sh
      mode: '0777'
    when: token_stat.stat.exists
  
  - name: run token to create results.txt
    shell: /mnt/script.sh
    when: token_stat.stat.exists

  - name: stat if exists results.txt
    stat: path=/mnt/results.txt
    register: result_stat

  - name: scp results.txt to master
    fetch: 
      src: /mnt/results.txt
      dest: /mnt/{{ ansible_hostname }}-results.txt
      flat: yes
    when: result_stat.stat.exists

讲一下这个剧本的任务:
第一个任务:查看指定路径下的文件是否存在并注册一个变量(用于后面when引用)
第二个任务:给此脚本增加执行权限
第三个任务:执行脚本
第四个任务:查看是否生成了results.txt文件并注册变量
第五个任务:使用fetch模块将各个节点的文件拉取到管控节点,由于文件名相同,所以需要在文件名前加一个节点的标识'ansible_hostname'是主机变量facts里面的变量,此处可以直接引用而不用在inventory里定义。还有一个需要注意的是,如果不加flat:yes选项的话,拉过来的文件会存放在dest定义的目录下的主机IP+src路径下。例如我上面如果没有加flat参数,则会放在

/mnt/kbj-002/172.16.0.7/mn/
/mnt/kbj-003/172.16.0.8/mn/
/mnt/kbj-004/172.16.0.9/mn/
...

此路径下,文件名还是节点上生成的文件名。

    1. 将获取到的信息收集到管理节点

这个在上面的的剧本中一并定义了。

    1. 将license分发到每个节点

本来还以为是有32个license文件,没想到只有一个,这样就好说了,也不用写剧本了,直接用ansible命令就能搞定

ansible kbj -m copy -a "src=/mnt/license dest=/home/work/program/conf/license mode='0600'"

    1. 统一拉起服务

这里用shell模块

ansible all -m shell -a "cd path/to/file;sh control start"
    1. 测试接口是否可用

也是使用的shell模块做的,用netstat -tnlp|grep PORT命令来对监听端口做检测,然后在执行脚本。
其实6、7、8这三步可以写成一个剧本来着,但是由于之前想刷主机名的剧本时用太多时间,导致现在不够用了,所以就直接在命令行执行了。

    1. 设置服务健康检查脚本并自动拉起

嗯,这个没什么好说的,在本机crontab -e写个计划任务,然后将计划任务里执行的脚本以及/var/spool/cron/root用copy模块分发到各个节点就OK了。

总结

算是第一次在项目上使用ansible吧,有些模块用的不是很熟练,例如register变量注册,facts里的主机变量怎么调用,fetch模块,为什么不用scp(因为没做免密),定义主机名时怎么用loop循环或者怎么定义变量可以让代码变少,而且看着还高大上。


2019-08-06更新
经过几天的测试以及同事给的思路,终于写好了ansible的playbook
实现需求3.配置主机名
ansible的hosts文件内容不变,尽量简洁

# cat /etc/ansible/hosts
[master]
172.16.0.6  ansible_ssh_pass='****'
[kbj]
172.16.0.[7:9]
172.16.0.1[0:9]
172.16.0.2[0:9]
172.16.0.3[0:7]
[kbj:vars]
ansible_ssh_pass='****'
[all:children]
master
kbj

然后剧本如下:

# cat set_hostname.yml
---
- hosts: kbj
  gather_facts: true
  vars:
    ip: "{{ ansible_all_ipv4_addresses[0] }}"
    ip_end: "{{ ip.split('.')[3] | int - 5"
  tasks:
    - name: set hostname for ip end number less than 10
      hostname: 'name=kbj-00{{ ip_end }}'
      when: ip_end|int < 10
    - name: set hostname for ip end number be equtal or greater than 10
      hostname: 'name=kbj-0{{ ip_end }}'
      when: ip_end|int >= 10

定义一个变量ip,是从主机变量里取出来的
然后定义一个变量ip_end,是取IP地址的最后一个'域',然后减去5,得到的这个数就可以用作用户名的变量,例如kbj-002;
定义一个任务,使用hostname模块,下面加了一个when判断,因为如果是10以内(不包括10)可以这么设置,但如果是10或者更大,比如11,那么按照上面的hostname,设置出来的主机名就是kbj-0011了,而不是kbj-011;
所以需要判断一下,10以下的用

hostanme: 'name=kbj-00{{ ip_end }}'

取值是10或者以上的用下面的方法设置主机名:

hostanme: 'name=kbj-0{{ ip_end }}'

而且上面的脚本也加了判断,一开始由于是在自己虚拟机上测试,忽略了这个问题。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,192评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,858评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,517评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,148评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,162评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,905评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,537评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,439评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,956评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,083评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,218评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,899评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,565评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,093评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,201评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,539评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,215评论 2 358

推荐阅读更多精彩内容