关于neutron ovn L3 HA 重调度或重均衡的设计

image.png

Gateway scheduling has been proposed in [2]. However, rebalancing or rescheduling was not a part of that solution. This specification clarifies what is rescheduling and rebalancing. Rescheduling would automatically happen on every event triggered by addition or deletion of chassis. Rebalancing would be only triggered by manual operator action.

ovn gw 的重调度已经实现了,曾经有一些bug。 该文档即阐述了 重调度和均衡的对象。 重调度动作由新增和删除chassis自动触发。 而再平衡只能由操作者手动触发

1. 关于gw chassis 的重调度

首先有一个最大gw chassis 数目限制,这个数据是5,感觉主备或三节点是一个好维护的选择。

既然最多是5个node,kube-ovn当前的基于configmap的方式指定gw nodes 方式是比较理想的维护方式,完全基于node的label和annotaion记录优先级或许过于灵活了。

当添加或移除chassis都会触发重调度,schedule_unhosted_gateways 这个方案会调用来处理为处理过的gw。 没有lrp(连接到公网)的routers会被排除在外。可以在ovn nbdb gateway_chassis 表中查到lrp关联到chassis的更多细节。

c1fd3af798dd4417ab242cd8032ae339.png

enable-chassis-as-gw 的chassis才有资源转发lrp来的流量,这些gw chassis基于优先级来确定哪一个来负责,优先级最大的来负责,其他的都是备份。

networking-ovn 目前支持两种方式来实现重调度。

  1. Least loaded 最小负载,优先选择最小负载的chassis。
  2. 随机选取

设计上的一些考虑:

  1. 如果有两个chassis,c1 和 c2,router 出网流量已经调度到这两个chassis其中一个,然后添加了chassis c3,那么此时只会出现 lrp的调度从c1切到c3, 或者 c2 切到c3. c1和c2 之间的重新决策和评估流程不应再出现。
  2. 为了“重新”调度router的chassis,当前的主chassis将原封不动。 然而,这种场景下,所有的router都会调度到一个chassis,而这个chassis已经是主chassis了。再添加第二个chassis,那么这个新的chassis只能成为优先级较低的chassis。

以下场景应该被考虑到:

场景1: 当系统内只有一个chassis C1,并且所有的router都已经调度到这个C1.然后我们添加 chassis C2.

期望结果: 如果C2的优先级更高,那么所有router都必须从C1切换到C2。

场景2: 当系统有两个chassis C1,C2,(C1的优先级更高),然后C1 掉电,

期望结果: 所有的router 都会调度到C2,而一旦C1 回来了,那么所有router将会重新调度到C1. C2 既然是新的master,那么C1的优先级会比C2低。 ??? (C1 优先级更低,怎么实现调度回C1)

场景3: 当系统有两个chassis C1,C2,然后加了个C3.

期望结果: 这种场景下,现有的router不会发生切换(C3优先更高也不行嘛??),假如router都在C1,那么C3加入后依旧在C1. 然而如果C3的优先级确实比较高,那么还是会发生切换,这取决于调度器的类型(随机还是最小负载)。

1. 关于gw chassis 的再平衡

再平衡是设计中的第二个部分,它会将新的master绑定给已经实现调度的gw 端口(lrp),也就是说,之前lrp已经选到了一个chassis,但是会发生给lrp切换chassis的情况。 当然这个操作会导致丢包(downtime)。 再平衡可以基于外部客户端脚本实现。类似的实现可以参考 dhcp重调度。重调度触发的条件是 正在用的chassis所承载的lrp数量超过了平均数量(所有lrp除以所有chassis)。 这个其实也是仅仅是从lrp的数量判断的,但是可能一个lrp的流量比其他lrp的总量加起来还要大,这个并没有从带宽饱和度来判断。

avg_gw_per_chassis = num_gw_by_provider_net / num_chassis_with_provider_net

场景1

系统只有C1 和 C2, 而且他们承担的chassis数目一样,重新平衡不会发生。
如果正好是奇数个chassis,会不会存在一个跳来跳去??

场景2

系统本来只有C1和C2,C1 有3gw, C2 有2gw
重新平衡不会发生,不会发生循环在不同 的chassis之间重复平衡gw。

场景3

系统本来只有C1和C2,加了一个C3,
重新平衡应该会发生,会按照上面的平均数算法来平衡。

场景4

系统本来只有C1和C2,C1连接到公网vlan1,C2 连接到公网vlan2.
重新平衡不会发生,因为这两个chassis分属于不通的运营商网络。

大致总结一下, 关于gw 如何选择chassis

假设我有三个gw chassis

  1. 静态指定gw chassis的优先级,把这三个gw chassis绑定给所有router gw的lrp,那么结果就是所有流量都调度到优先级最高的那个,如果挂了,就切到较低优先级的那个, 这三个chassis也可以基于ha-chassis-group维护,可以自动切换,高可用更好一些。
  2. 基于network ovn的调度策略(最小GW LRP负载或者完全随机)+ 平衡策略搞,用户只需要指定三个gw chassis,不要设置优先级。那么随着 chassis数量的改变和gw数目的改变,networking ovn 会尝试变换不同的chassis给gw,目前的实现也是没法基于“带宽”做最小负载的。
  3. 还有一种方式就是kube-ovn目前在用的方式,结合port-group 和策略路由去本地直接出,或者基于ECMP hash到这3个网关节点出。

参考: https://docs.openstack.org/networking-ovn/latest/contributor/design/l3_ha_rescheduling.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,029评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,238评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,576评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,214评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,324评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,392评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,416评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,196评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,631评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,919评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,090评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,767评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,410评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,090评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,328评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,952评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,979评论 2 351

推荐阅读更多精彩内容