登录注册写文章

ingress异常导致整体网络不可用

ingress异常导致整体网络不可用

k8s中刷新nginx失败,导致整个网络不可用

测试环境中所有新发布的应用全都不可用,瘫痪的1个小时左右.
一路查下来发现问题是nginx刷新异常,记录一下.

基础环境

Kubernetes 1.10

现象

新发布的应用无法访问,频繁出现504错误.

查询后台日志
发现后台大量的刷新Nginx配置失败问题.问题瞬间定位了.
upstream不存在
删除了不存在的upstream后网络恢复正常

问题描述

k8s的集群中使用了Nginx作为反向代理.
如果你发布一个新的应用,Ingress会根据规则动态的把配置文件写入到Nginx的default.conf中,此时会校验upstream是否存在,如果不存在则会刷新失败.

Ingress有bug?
这套流程正常的话,endpoint的访问都是由k8s控制的,原则上是不会有异常的,那么怎么出的问题?
A/B Testing惹的祸
我们实现灰度发布的方案是依赖于在Nginx中实现Lua脚本,如下:

location / {
    ....
    if ($http_foo = "bar") {  //完全匹配
    #if ($http_foo ~ "bar") {  //正则匹配
           proxy_pass http://default-new-nginx-80;
           break;
    }
    proxy_pass http://default-old-nginx-80;
    ....
}

问题来了,除了k8s的正常流程外,我们还会通过发布系统来控制应用的生命周期,相当于废除了k8s的控制.
实现了此套方案后只要通过k8s系统直接删除pod或者扩容等操作都会造成异常.
所以现在考虑更优解.

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

一分钟告诉你究竟DevOps是什么鬼？
历史回顾为了能够更好的理解什么是DevOps，我们很有必要对当时还只有程序员(此前还没有派生出开发者，前台工程师...
陌上尘飞123阅读 3,114评论 0赞 0
寒衣节念故人未归
寒来渐觉衣生凉，青丝白发两茫茫。梦里相逢朝复暮，孤坟独处诉离殇。
醉酒非酒阅读 2,924评论 0赞 1

SSH远程登录连接docker容器
环境：计算机A为本机计算机；计算机B上创建docker容器；目的：在A上ssh远程登录B上的docker容器： ...
樱桃小丸子zz阅读 14,415评论 0赞 8
核心2群2组Fj方婕阅读输出16/51
少有人走的路——心智成熟的旅程之爱:浪漫爱情的神话读完全文，不认同作者的观点。每个人对于爱情有不同的定义，不同作...
荷妍阅读 1,000评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文