概述
在9月M$发布了其首个 Linux 网络操作系统 ACS 之后,HP 也不甘寂寞地在 2015/10/5 发布了其基于 Linux 的开源网络操作系统 OpenSwitch,主要参与者包括 Accton, Arista, Broadcom, Intel,QOSMOS, Vmware,参与者相对于其他的开源项目而言,略显不足,特别是 ODM 厂商只有 Accton 一家。
OpenSwitch NOS 聚焦于数据中心交换机,支持 OCP 兼容交换机,通过 ONIE 安装/卸载,系统提供完备的 L2 与 L3 层网络协议。
OpenSwitch 与著名的 Open vSwitch 只差了个v
,说明这两者是颇有渊源的,具体的见后文描述。
开发环境需求
最低硬件要求
- 2 core CPU
- 4 GB 内存
- 30 GB 硬盘空间
推荐硬件要求
- 4 core CPU
- 8 GB 内存
- 50 GB 硬盘空间
开发环境
官网提供了基于 Vagrant 的开发环境安装指导,如果没有使用过 Vagrant,官方推荐在 Ubuntu 平台上部署开发环境。
OpenSwitch 还支持在主流的 Linux 平台上部署开发环境,包括 Debian, Fedora, Suse 等,具体见官网的部署指导。
OpenSwtich 的源码可以从官网下载,代码并没有托管在官方的 github 上,这个在当下的开源社区中略显得有点非主流,估计后续会迁过去。 源码中包含了多个工程,如果只想编译出 image 的话,不需要 clone 源码,只需要 clone openswitch/ops-build 库即可。
具体的开发环境配置指导可以参看官网的 Step-by-step Guide.
软件架构
系统状态数据库(System state database)
System state database 即系统级的 OVSDB,是集中式的数据库,用于存储所有用户进程的配置、状态以及统计数据等信息。
状态数据库虽然简化了配置以及数据存储的实现,但其主要的目标并非如此,集中式的数据库是被设计来用于各个功能进程间信息交互,各功能进程不允许通过其他的方式交互,只能够使用状态数据库。
OpenSwtich 通过状态数据库以及功能进程业务交互的实现约束,解决多业务进程间的控制时序依赖的问题。
OVSDB-Server 是个成熟的内存数据库,其实现遵从于 OVSDB 协议(RFC 7047),数据库实现提供一套完善的事务处理机制以及灵活数据变化的订阅功能。
OVSDB作为系统的基础架构,还提供了数据一致性管理以及垃圾回收机制。
系统中的各业务进程均通过 OVSDB 协议与 OVSDB-Server 进行通讯,同时也支持外部系统通过 OVSDB 协议与 OVSDB-Server 进行数据交互。
ops-switchd
ops-switchd 是系统中唯一允许访问 SDK 的进程,其主要作用是将 OVSDB 的数据模型转换为 ASIC 的数据并调用相应的 API,其为 Open vSwitch 中的 ovs-switchd 的扩展,SDK-Ind 层与 SDK-Spec 层之间的接口按 Open vSwitch 的 OFProto Provider
与 NetDev Provider
接口扩展设计,API 定义参看源文件 netdev-provider.h 与 ofproto-provider.h .
ops-switchd 的内部设计需求是为适配不同的芯片厂商的 SDK 服务,对于非 Broadcom 方案的硬件平台上,只需要移植 ops-switchd 中 SDK-Spec Plugin 即可,当前已实现的 SDK-Spec Plugin 支持:
- OpenNSL plugin: 基于 OpenNSL SDK 接口,支持 Broadcom Trident II 系列芯片
- Docker container plugin: 支持在 Docker 容器中运行 OpenSwtich。
硬件管理进程
OpenSwitch 提供了一系列硬件管理相关的进程,其中工作在内核外设驱动与 OVSDB 之间,主要包括:
- 风扇管理进程
- 温度管理进程
- 电源管理进程
- LED 管理进程
- 模块热插拔管理进程
虚接口管理进程
交换的每个物理端口以及逻辑接口(VLAN、LAG、Tunnel)等在内核中都有对应的虚接口(virtual port),通过这种实现,控制面的协议收包时(如L2 BPDU、L3 协议报文)不需要遍历 OVSDB 中的信息。
对于交换机的物理端口是通过 SDK 驱动的方式在内核中创建接口,之后交换机即可以在这些接口上进行报文的收发。
L2/L3协议进程
每个协议都有自己独立的守护进程(daemon),守护进程通过raw,UDP或TCP的sock从内核中相应的接口上收帧。
OpenSwitch的LLDP组件源于 Vincent Bernat, LACP 组件则是由 HP 自行开发。
OpenSwitch的L3协议来源于开源项目 Quagga 。
系统进程
OpenSwitch 中还存在许多与外部业务无关的进程,其主要工作是管理 OVSDB 中的相关数据信息,主要包括:
- 初始化以及部署子系统的 ops-sysd
- 保存并加载配置文件的 ops-cfgd
- 管理系统接口速率/双工/流控的 ops-intfd
- 等等
管理/监控进程
虽然 OVSDB 是个强大的协议,通过此协议也能够对系统的状态进行管理与监控,但 OVSDB 协议当前并未被广泛使用,OpenSwitch 提供了多种的用户管理代理进程,主要包括:CLI、REST API、Ansible、Chef 等等。
硬件设计
OpenSwitch 官网提供 硬件设计指导 的链接,不过当前打开里头没有内容(也有可能是我打开的姿势不对吧 -_-!)。
最后
在交换机的开源硬件、软件项目中 Broadcom 玩得不亦乐乎,但始终没有见到 Marvell 身影,这位同学在 DC 领域失踪很久了,目测再出现的可能性也不大了。
[end]
—