linux vxlan测试

场景描述

image.png

linux上部署vxlan涉及两个部分:

  1. overlay网络配置
  2. vxlan隧道
    overlay网络要支持随意配置且与主机网络隔离,vxlan隧道要使用本机IP地址作为vtep ip。
    网络隔离显然要使用netns,当然我们也可以使用docker间接使用netns。

开始之前

  1. 内核vxlan module启用的端口设置为4789
cat /sys/module/vxlan/parameters/udp_port
rmmod vxlan && modprobe vxlan udp_port=4789
  1. 放通iptables
iptables -t filter -I FORWARD -j ACCEPT

vxlan组网的几种方案

以本地接口地址为192.12.34.2/24, overlay远端地址为10.1.1.14举例。

路由指向vxlan隧道(不推荐)

image.png
  1. 路由指向vxlan隧道
  2. 配置静态ARP作为内层目的MAC,进入隧道后直接封装vxlan报文转发
    命令配置示例:
# S1: 配置overlay地址,IP地址配置到任意接口即可
ip addr add 192.12.34.2/24 dev lo

# S2: 创建vxlan隧道
ip link add vxlan_tunnel type vxlan id 67185 remote 10.29.46.21 local 10.22.0.47 dstport 4789 dev eth1
ip link set vxlan_tunnel up
ip link set dev vxlan_tunnel addr  00:12:34:56:78:90

# S3: 配置路由
ip route add 10.1.0.0/16 dev vxlan_tunnel

# S4: 配置静态ARP
ip neigh add 10.1.1.14 lladdr 1a:1b:1c:1d:1e:1f dev vxlan_tunnel

# ping
ping 10.1.1.14 -I192.12.34.2

方案缺陷

  1. 无法使用netns
    • vxlan隧道必须绑定本地接口地址eth1,所以vxlan隧道不能使用netns
    • overlay路由指向vxlan隧道,所以overlay地址必须跟vxlan隧道在同一个netns。既然vxlan隧道不能使用netns,那overlay地址也不能使用netns。
  2. 必须配置ARP明细
    vxlan隧道内转发依靠静态ARP,所以目的IP都需要配置静态ARP。本例中10.1.0.0/16内所有的IP都要配置静态ARP,好在多个IP可以配置相同的mac地址,不会冲突
    # 多个IP可以配置相同的MAC地址
    # ip neigh | grep 1a
    10.1.1.14 dev vxlan_tunnel lladdr 1a:1b:1c:1d:1e:1f PERMANENT
    10.1.1.15 dev vxlan_tunnel lladdr 1a:1b:1c:1d:1e:1f PERMANENT
    

二层桥接

image.png

linux通过veth和bridge连接两个netns。我们自然想到了桥接的方案。桥接方案的转发原理:

  1. overlay netns内配置overlay地址和overlay互联地址
  2. overlay netns内,路由指向overlay互联地址
  3. overlay互联地址通过bridge与vxlan隧道二层打通
    命令配置示例:
## s1: create netns, network, net-vpc<id>
ip netns add net-vpc67185
ip netns exec net-vpc67185 ip link set dev lo up

## s2: create bridge, br-vpc<id>
ip link add br-vpc67185 type bridge
ip link set dev br-vpc67185 up

## s3: create vxlan and attach to bridge
ip link add vxlan-vpc67185 type vxlan id 67185 remote 10.29.46.21 local 10.22.0.47 dstport 4789 dev eth1
ip link set vxlan-vpc67185 up
brctl addif br-vpc67185 vxlan-vpc67185

## s4: create veth, and attach to bridge and netns
ip link add tap-vpc67185 type veth peer name veth-vpc67185
ip link set veth-vpc67185 master br-vpc67185
ip link set veth-vpc67185 up
ip link set tap-vpc67185 name eth0 netns net-vpc67185
ip netns exec net-vpc67185 ip link set eth0 up

## s5: set mac
ip netns exec net-vpc67185 ip link set dev eth0 addr 00:12:34:56:78:90

## s6: set secondary ip address
ip netns exec net-vpc67185 ip addr add 169.254.0.201/24 dev eth0

## s7: set arp
ip netns exec net-vpc67185 ip neigh add 169.254.0.200 lladdr 1a:1b:1c:1d:1e:1f dev eth0

## s8: set ip and route
ip netns exec net-vpc67185 ip addr add 192.12.34.2/24 dev eth0
ip netns exec net-vpc67185 ip route add 0.0.0.0/0 via 169.254.0.200 src 192.12.34.2

## ping 
ip netns exec net-vpc67185 ping 10.1.1.14

二层桥接方案的优势

  1. 与主机网络空间隔离
    • 主机netns下仅创建bridge和vxlan隧道。bridge和vxlan隧道都不需配置IP地址
    • overlay地址和路由都在独立的netns下配置
  2. 仅需配置默认路由
    • 示例中配置了overlay静态arp,实际上overlay arp可以自学习
    • 只需配置一条默认路由即可

踩过的坑

  1. linux vxlan模块默认启用的端口不是4789
  2. iptables默认拦截了udp协议报文
  3. vxlan隧道dev错误的指向了eth0,且eth0未配置IP地址,此时虽然会封装vxlan报文,但是会直接请求远端vtep的ARP
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。