使用ansible修复containerd容器逃逸漏洞

关于容器逃逸漏洞 CVE-2020-15257，网上已经有很多文章分析了，验证手段及修复方案也挺简单，升级 containerd 到指定版本即能修复漏洞。至于怎么升级 containerd，对于需要管理多个 K8s 集群的管理员来说就得好好考虑一下了。

最容易想到的方案是手工一个一个节点升级，简单可行，就是容易疲劳操作，后续有类似的事情还得这么干一遍，集群跟节点规模大了的话，这种操作就太骚气了，这么干不是个好办法。
因此我们决定写个 ansible playbook，一劳永逸，方便后面类似的工作可以复用代码。

想要自动化操作，我们得要理一下思路，想清楚操作逻辑，怎么做才能确保影响面最小，因为升级 containerd 涉及到容器引擎的重启，不可避免的业务容器也得要重启了。

我们大概整理了一下思路：
- 先升级 master 节点，待 master 节点升级完成后再升级 worker 节点
- 操作一个节点前先判断集群所有节点的状态是否正常，如集群所有节点状态均正常，则升级该节点的 containerd，如有集群节点状态不正常，则异常退出
- 当一个节点升级 containerd 完成后检测本节点的 kubelet 状态，待 kubelet 正常后再进行下一个循环，若检查 5min kubelet 都没法正常则同样异常退出
- 一个一个节点滚动轮询
其实这里还可以做更多的逻辑判断，比如说升级完一个节点之后加上检查整个集群所有 pod 的状态以及集群网络等等（实际上应该根据不同的实际环境情况来定判断逻辑的）。但根据混沌工程理论，我们认为随便故障三几个节点都不应该影响整个集群以及应用的健康状态，这个理论跟 K8s 的能力也是匹配的。

理清楚思路，写代码就相对简单了。

首先，定义一个 ansible roles

# 所有代码就几个文件，还是非常简单的
.
├── update_node_containerd
│   ├── files
│   │   └── check_node_status.sh
│   ├── README.md
│   ├── tasks
│   │   ├── install_jq.yml
│   │   ├── main.yml
│   │   └── update_containerd_loop.yml
│   └── vars
│       └── main.yml
└── update_node_containerd.yml
# 指定操作机器范围以及使用串行的操作方式
---
- hosts: update_containerd
  remote_user: root
  serial: 1
  gather_facts: false
  roles:
    - update_node_containerd

接着进入 role 的 main.yml，更新 yum repo(包含新版本的 containerd)，安装 jq 以及进入判断升级 containerd 循环。

---
# tasks file for update node containerd
# Configure intranet YUM repo
- name: create-yum-repo
  shell: curl http://{{ yum_server }}/repo/get_yum_L7_latest.sh | bash

# include update containerd
- include: install_jq.yml
- include: update_containerd_loop.yml

进入升级 containerd 循环
- 注册一个变量，用于定义检查集群状态
- 若集群状态正常，则升级当前节点的 containerd 版本
- 升级完 containerd 版本后检查当前节点的 kubelet 状态，若 5min 后依然异常则异常退出

---
# tasks file for update containerd
- name: check-node-status
  script: check_node_status.sh
  register: node_state_result

- name: update-containerd
  yum: 
    name: ['containerd.io-1.3.9-3.1.el7']
    state: present
  when: "'error' not in node_state_result.stdout"

- name: waiting-kubelet-to-come-back
  local_action:
    module: wait_for
    host: "{{ inventory_hostname }}"
    port: 10250
    delay: 5
    timeout: 300
    state: started

- fail:
    msg: "Conditions established,Interrupt running playbook"
  when: "'error' in node_state_result.stdout"

check_node_status.sh
- 通过集群 api 检查集群节点状态，如有非正常状态则返回 error

#!/bin/bash

set -euo pipefail

api_url=""
api_token=""
k8s_cluster=""

# sleep 1min wait for cluster status ready
sleep 60

# check the cluster node status
for item in $(curl -sSk -H "Authorization: Bearer ${api_token}" ${api_url}/clusters/${k8s_cluster}/nodes | jq -r '.data[].state'); do
    case "$item" in
        active|cordoned)
            echo ready
        ;;
        unavailable)
            echo error
        ;;
        *)
            echo error
        ;;
    esac
done

代码就这么多了，其实还是很简单的，做这些事情都是为了总结一下思路，为后面类似的工作偷偷懒。

运维工作是一个知识积累的过程，能在工作中明确思路，运用自己的知识是一件比较幸运的事情。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 213,752评论 6赞 493
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,100评论 3赞 387
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 159,244评论 0赞 349
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,099评论 1赞 286
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,210评论 6赞 385
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,307评论 1赞 292
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,346评论 3赞 412
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,133评论 0赞 269
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,546评论 1赞 306
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,849评论 2赞 328
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,019评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,702评论 4赞 337
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,331评论 3赞 319
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,030评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,260评论 1赞 267
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,871评论 2赞 365
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,898评论 2赞 351

使用ansible修复containerd容器逃逸漏洞

推荐阅读更多精彩内容