公司找项目也真的是五花八门,之前是各种RPA机器人软件的学习使用,如今又瞬间跳到运维软件上了,不过针对之前,这次的k8s的学习还是挺感兴趣的,毕竟这与开发后的一系列事宜有关,但是时间太赶,还是和rancher公司的人合作,各种嫌我们进度慢,说实话,入门搞基础太琐碎了。
多的就不说了,在跟随官方文档练习在练习各种方式的搭建HA集群。这几天练习的离线搭建,遇到了一个很无奈的问题,但是这么经典的问题,我翻墙也没找到一两个靠谱的答案,具体是:
rke up --config ./rancher-cluster.yml
即通过rke命令行工具以及配置文件快速生成一个高可用k8s集群,但是每一次都会出现如下错误:
其实之前走的挺顺利的,但是离线搭建涉及到将镜像下载并拉取到本地,再推送到远程仓库,结果由于主机分配内存太小,执行失败了,个人认为可能跟后面重复执行的步骤没有覆盖老的内容,导致一直报错,后来通过使用上面知道人员给的一段shell命令集,在每个集群中的主机节点执行后,再执行该命令,完美构建,成功!如下是命令集:
df -h|grep kubelet |awk -F % '{print $2}'|xargs umount
sudo rm /var/lib/kubelet/* -rf
sudo rm /etc/kubernetes/* -rf
sudo rm /etc/cni/* -rf
sudo rm /var/lib/rancher/* -rf
sudo rm /var/lib/etcd/* -rf
sudo rm /var/lib/cni/* -rf
sudo rm /opt/cni/* -rf
sudo ip link del flannel.1
ip link del cni0
iptables -F && iptables -t nat -F
docker ps -a|awk '{print $1}'|xargs docker rm -f
docker volume ls|awk '{print $2}'|xargs docker volume rm
systemctl restart docker
可能会有些步骤报执行不成功或错误,这些都不要紧的,都是为了删除k8s相关文件以及网络,挂载等,在重新构建集群命令之后会重新生成的!