美国国家科学基金会如何推动SDN的发展-翻译

SDN的又一篇总结,Communications of the ACM再次发布 Nick和Jeniffer 联袂长文,估计是要跟大统领要经费,只是川建国第二任期下还能要到吗。

How the U.S. National Science Foundation Enabled Software-Defined Networking
The investments NSF made in SDN over the past two decades helped revolutionize network design and operation across public and private sectors.
原文链接如下:
https://cacm.acm.org/federal-funding-of-academic-research/how-the-u-s-national-science-foundation-enabled-software-defined-networking/

互联网作为现代生活的重要基石,通过接入网络将数十亿用户与广域骨干网相连,最终接入数据中心运行的无数服务。商业互联网在1990年代至2000年初飞速发展,得益于网络所有者无需依赖中央管理机构,即可轻松连接路由器等可互操作设备。然而,少数路由器供应商同时控制着硬件与设备软件,导致网络所有者对其网络行为的控制权受限。新增网络功能既需要供应商技术支持,又需经历长达数年的标准化流程以确保跨厂商互操作性。这导致路由器软件臃肿不堪(代码量达数千万行)、网络管理异常困难,创新进程缓慢得令人沮丧。

软件定义网络(SDN)的出现彻底改变了这一局面,使网络所有者重获网络行为控制权。其核心思想简明有力:首先,网络设备应向数据包转发逻辑层提供统一的开放接口,使独立控制软件能安装精细规则,指导设备处理不同类型数据包—丢弃、转发、如何修改包头等;其次,网络应实现逻辑集中控制,使控制软件具备全网视野并能直接管理分布式网络设备集群。这些控制软件无需运行于网络设备本身,而是部署在独立计算机集群上,对单一网络设备进行实时监控与管理。

SDN的商业化部署始于2008年左右,其成功可追溯至两项相互促进的融合发展:一方面是美国国家科学基金会资助的学术研究取得突破,另一方面是云服务企业开始构建超大规模数据中心,需要新型网络技术互联数以千计的服务器机架。超大规模服务商采用SDN技术后形成良性循环,既推动了更深层次的学术研究,又催生出重大创新成果与多家成功初创企业。

如今,SDN技术已彻底重塑各类网络的构建与运营模式—从公共互联网、企业私有网络、高校与政府专网,直至连接我们智能手机的蜂窝网络,无不深受其影响。
美国国家科学基金会(NSF)早期的SDN资助计划。2001年,美国国家科学院发布报告《Looking Over the Fence at Networks: A Neighbor’s View of Networking Research》,直指互联网僵化的危机—网络难以适应新需求。该报告揭示了僵化的三个维度:知识层面(向后兼容性限制了创新思维)、基础设施层面(新理念难以融入现有设施)和系统层面(僵化架构导致脆弱而牵强的解决方案)。NSF以前所未有的魄力,通过未来十年持续投入巨资应对这一挑战。这些投资为SDN奠定了基石。以下我们将透过自身研究团队获得的资助,透视NSF的关键布局。值得注意的是,这些政府资助项目培育的研究共同体,为日后SDN的商业化普及开辟了道路。

百兆入户计划(100×100项目):2003年,NSF启动百兆入户计划作为信息技术研究项目的重要组成部分。该项目旨在构建能为全美1亿家庭提供百兆带宽的通信架构,汇聚了卡内基梅隆大学、斯坦福大学、伯克利分校及AT&T的研究力量。其核心突破在于大型网络管理方式的创新,催生了分布式数据平面逻辑集中控制的4D架构(该架构本身是对AT&T路由控制平台的拓展与通用化)、Ethane(企业网络逻辑集中访问控制系统)、OpenFlow(交换机中匹配-动作规则的开放接口),以及首个开源网络控制器NOX。

网络创新全球环境(GENI):NSF与研究界渴望在国家级平台上验证新型互联网架构。受计算机虚拟化技术启发,2005年《Overcoming the Internet Impasse through Virtualization》提出网络虚拟化路径。次年NSF启动GENI项目,致力于构建可编程的国家级共享实验平台,支持大规模互联网架构创新。GENI资助了校园早期OpenFlow部署,并通过FlowVisor实现网络切片—允许多个实验网络在相同物理链路上并行运行,各由独立控制器管理。这催生了Beacon、POX和Floodlight等开源控制器集群。该项目还孕育了可编程虚拟骨干网平台,以及连接多所高校的Internet2实验性OpenFlow骨干网,进而推动思科、惠普和NEC推出支持OpenFlow的交换机。GENI更资助采购ODM厂商的OpenFlow白盒交换机及配套开源软件,NSF资助的NetFPGA项目则实现了Internet2的实验性OpenFlow交换机部署。NSF汇聚的研究共同体远不止于搭建实验平台,许多研究者逐渐认识到可编程性与虚拟化正是未来网络的核心能力。

未来互联网设计(FIND):2007年NSF启动FIND计划,支持在GENI测试床上原型化验证新型互联网架构。2010年其继任项目未来互联网架构(FIA)进一步扩大研究社群,推动颠覆性网络架构设计与替代方案探索。这些研究催生了支持移动性增强、内容分发、用户隐私保护、安全云计算等大胆构想。通过原型验证与实地评估,FIND与FIA计划孕育出众多融合SDN并夯实其基础的创新架构。当颠覆性网络研究在美国形成浪潮时,欧盟等地区也相继启动类似项目(如欧盟未来互联网研究与实验计划FIRE)。

可编程开放移动互联网(POMI)远征计划:2008年斯坦福大学的NSF POMI远征计划扩大了对SDN的资助范围,涵盖其在移动网络的应用。该计划支持了开源分布式控制器ONOS的早期研发,开发了广泛应用于SDN教学与实网部署前测试的Mininet网络模拟器,并开创了可编程转发平面研究,为首款全可编程交换芯片和流行P4语言的出现铺平道路。

云服务巨头对SDN的采纳。在SDN学术研究蓬勃发展的同时,微软、谷歌、亚马逊和Facebook等科技巨头开始建设容纳数万台服务器的超大规模数据中心。面对商用网络设备高昂成本与复杂性问题(单台数据中心交换机超2万美元,单站点需部署约万台),这些企业选择采用博通和Marvell等公司的商用交换芯片自主构建成本约2000美元的交换机,并运用现代软件开发理念自主研发优化软件。降低成本虽重要,但SDN真正赋予的是他们梦寐以求的控制权。

超大规模服务商通过SDN实现了两大关键应用场景:其一,数据中心内部网络虚拟化—源自NSF资助Ethane项目的初创企业Nicira开发网络虚拟化平台(NVP),为每个企业租户提供独立IP空间与策略的虚拟网络。该公司后被VMware收购,NVP演进为NSX。其开源的Linux虚拟交换机Open vSwitch(OVS)配备OpenFlow接口,已成为全球数据中心网络虚拟化的核心引擎。其二,广域网流量调度—谷歌在其B4骨干网中采用OpenFlow交换机与首款分布式控制器平台ONIX,实现了跨数据中心流量调控。2012年在开放网络峰会上公布的B4实践,引爆了全球SDN研究与商业化热潮。ACM SIGCOMM会议涌现大量相关论文,最终催生软件定义网络热点研讨会(HotSDN,后更名为SOSR)独立会议。

多租户虚拟化与广域网流量工程这两大标杆应用,使SDN获得产业界高度重视。NSF资助的研究直接催生了多家成功初创企业:Big Switch Networks(开源SDN控制器与管理应用,被Arista收购)、Forward Networks(网络验证产品)、Veriflow(网络验证产品,被VMware收购)、Barefoot Networks(可编程交换机,被英特尔收购)等。SDN更推动思科、Juniper、Arista、惠普和NEC等传统厂商全面布局SDN产品线。如今AMD、英伟达、英特尔和思科均推出P4可编程产品,201年ACM SIGCOMM会议上约三分之一论文基于P4或可编程转发技术。

SDN的商业成功反过来激发了学术界的深入研究。NSF与国防高级研究计划局(DARPA)等机构持续资助SDN平台与应用研究,研究范畴从计算机网络扩展至编程语言、形式化验证、分布式系统、算法及网络安全等交叉领域,共同为未来网络构筑更坚实的基石。

本文梳理了SDN的发展脉络。因SDN衍生的研究项目、论文、企业与产品浩如烟海,难免挂一漏万。NSF在二十一世纪初的高瞻远瞩,恰逢其时地培育了一代研究人员,与快速崛起的云服务巨头形成合力,彻底改变了当代网络的构建方式——这无疑是一场真正的网络革命。

SDN Grew First and Fastest in Datacenters

SDN的首轮大规模部署始于2010年左右,在超大规模数据中心率先落地。这段历程由云巨头亲身讲述最为真切,我们特邀谷歌、微软Azure与Meta的负责人分享他们采纳SDN的动因与路径。正如我们将看到的,这些企业均以NSF资助研究提出的理念为基石,并根据自身需求与文化对SDN进行了个性化改造。
SDN at Google, as recounted by Amin Vahdat述:
自创立之初,谷歌基础设施服务就专注于分布式系统扩展。我们的数据处理、存储系统和网页搜索等服务均运行于成千上万台集群服务器,再通过私有广域网实现全球互联。传统互联网协议虽擅长多独立系统间的去中心化管控,却因追求自治而牺牲了性能与可靠性的极致化。这些协议依赖节点间消息传递、基于端点的可用容量测量,以及对网络动态的最终一致性收敛,包括故障与扩容。

受自身分布式架构及NSF资助的光学可重构拓扑、数据中心架构与网络虚拟化研究的启发,我们发现通过逻辑集中控制可从根本上提升网络系统的可靠性、性能与效率。相较于在嵌入式交换芯片CPU上运行完全分布式协议,或依赖无数端点自主收敛至公平带宽,由掌握全局蓝图的集中控制器能实现跨越式提升的可靠性与扩展性。

我们据此以SDN原则系统重构网络:打造私有SDN广域网B4连接全球数据中心,初代设计即实现站点间十倍于传统架构的带宽。这依托两大洞察:其一,采用浅缓存交换机并通过动态流量工程响应网络变化,大幅降低空间、功耗与成本;其二,借助私有网络优势,自由调整终端拥塞控制协议以优化广域网动态延迟。

在数据中心网络层面,我们构建了每秒支持petabits跨度的Jupiter架构。其核心在于利用海量多路径提供可扩展带宽,并在单栋建筑部署数千交换机、数十万链路的场景下,通过逻辑集中控制快速应对设备故障。

最终,我们通过Espresso将SDN延伸至公共互联网:利用实时终端测量,动态选择谷歌服务器与全球用户通信的最佳出口节点。每个服务前端将流量封装至网络边缘服务器,依托全球多地域互联节点,基于实时测量数据为不同用户群动态优化接入路径。

SDN还带来两项意外之喜:首先,控制面与数据面的逻辑分离让我们能构建基于服务器的冗余控制系统,通过无缝升级技术实现周级功能迭代。这种敏捷性成为效率提升的关键,相较于传统网络6-12个月的升级周期,我们实现了快速试错与持续优化。其次,集中化网络视图使故障与拥塞响应速度远超依赖最终一致性的分布式协议。尽管初衷是降本增效,但SDN设计使网络可靠性提升十倍,这很大程度上也归功于生产环境的快速迭代能力。可靠性的飞跃,或许正是谷歌SDN之旅最令人欣慰的成果。

SDN at Microsoft Azure, as recounted by Dave Maltz:
云服务商的经济模型高度依赖SDN—我们批量采购低成本同构服务器,再通过SDN技术将庞大资源划分为可定制网络策略的虚拟切片。虽然各厂商已基于SDN理念构建了日处理数十亿变更的可靠系统,但其思想根源始终可追溯至NSF资助的研究。

除理论成果外,NSF资助所构建的人际网络同样关键。以百兆入户计划为例,它促成的跨学科合作催生了VL2论文—如今多数云与私有数据中心的架构准则正源于此。该项目让路由器架构师与网络管理学者碰撞出关键灵感:“能否将单台路由器的设计理念扩展至整个数据中心?”经济学家与技术专家的联合分析则指引了基础设施投资方向。NSF不仅聚焦研究盲区,更培育了原本永无交集的领军者社群。

SDN的控制转发分离理念影响远超起源领域。以解耦网络为例,架构师应能自由选择路由硬件之上的操作系统,并可随意定制。云开源网络系统已部署于数百万端口,覆盖云服务商、互联网供应商、私有数据中心及工商业企业。它在AI、光网络、企业网及监控等领域的快速创新,皆可溯至SDN。

SDN at Meta, as recounted by Omar Baldonadoz:
SDN的兴起恰逢 Meta 在21世纪末至22世纪初的快速扩张期。尽管网络产业随互联网蓬勃发展,但我们的网络团队仍需要更高控制力与灵活性。在研究NSF资助的SDN早期成果后,我们启动了多项SDN衍生项目。

Breadth of inspiration。我们在数据平面API与逻辑集中控制基础上,开发了集中控制器与分布式协议协同的混合控制平面,并将其部署于全球网络:广域网骨干采用集中控制器结合分布式路由;边缘网络部署基于BGP的流量调控系统;数据中心则运行自定义分布式协议与集中控制器协作。

可靠性提升方面,SDN启发我们重构全生命周期软件系统。通过将中央配置监控系统与自动化控制深度集成,实现了更高网络可靠性。

开放解耦层面,受GENI项目与早期商用SDN实践启发,我们联合多家云厂商发起OCP网络工作组,推动全栈软硬件解耦。开源交换机抽象接口与自研系统已在全球交换机上稳定运行。

AI网络领域,近年来我们继续运用SDN理念构建高性能AI计算集群。基于同款以太网交换机构建的集中式解耦软件系统,持续满足模型训练与推理需求。展望未来,我们正在构建全球互联的AI超级计算机。

过去十五年间,NSF对SDN的前瞻投资持续激发Meta的网络创新与开放协作。随着基础设施向个性化通用人工智能扩展,SDN衍生理念与系统将继续发挥核心作用。

电信运营商同样对SDN展现出强烈兴趣。AT&T在中期便参与研究并率先部署,我们特邀时任负责人Albert Greenberg讲述这段历史。

SDN at AT&T, as recounted by Albert Greenberg

SDN的指导原则早在1990年代便诞生于AT&T实验室。作为关键任务基础设施,AT&T全球骨干网必须实现低成本设计与运维,在承受互联网流量爆发式增长的同时,抵御交换机、链路、对等网络及用户网络的全维度故障。在持续扩容与修复的动态环境中,网络必须提供稳定、可预测的高质量服务。

IP网络机制本就被设计成超级自适应—接入设备即可自动发现邻接节点与可达目标,随后流量自然贯通。这种极简设计与去中心化管控使IP网络空前成功,让所有早期大规模技术黯然退场。但基础构件之上,仍需系统与工具来编程网络。AT&T实验室创建的系列工具至今仍是行业核心:大规模流量矩阵估算、网络模拟器、海量遥测数据处理流水线、基于全局视图的可编程配置系统。遗憾的是,早期SDN未能直接表达用户或运维意图。例如应急维护中的服务保障仍需人工介入。进入云时代后,通过智能路由服务控制点及早期SDN工具构建的NetBond系统,实现了数十万客户零接触接入云虚拟网络。

NSF资助的学术合作同样助力AT&T实验室及整个SDN领域的研究突破。实验室汇聚工程师、研究员与攻读学位的实习生,孕育出重大创新。实习生既获得行业报酬,更积累无价洞见与声誉,最终转化为博士论文与职业生涯。思想与原型在Emulab及大学实验室中得到验证,100×100 Clean Slate等项目成果多数走向产业化。4D论文正是源自该项目,成为点燃SDN革命的火种之一。实现4D愿景缺失的一环是设备可编程性,而博通等公司的白盒交换芯片与英特尔等企业的服务器恰逢其时地填补空白。在此基础上,开源与闭源软件如潮涌现,并在期间全面转向云生态。志同道合的工程师们继续为云生态注入动力,VL2论文体现的SDN洞见为Azure秒级创建海量虚拟网络奠定基础。与此同时,在AT&T公司,由John Donovan推动的软件定义网络(SDN)革命在蜂窝移动和广域网领域蓬勃发展,这一成果是通过与DriveNets及Affirmed Networks(后被微软收购)等企业合作实现的。

Nicira或许是SDN运动最具代表性的初创企业。它起源于NSF资助的百兆项目与斯坦福Clean Slate计划,基于Martín Casado的博士研究。Nicira开发了首个分布式控制平面、首款合规软件交换机及首套网络虚拟化平台。我们特邀首席架构师Teemu Koponen讲述这段历程。

Nicira: SDN and Network Virtualization, as recounted by Teemu Koponen

虚拟化如今已成为数据中心服务器、存储与网络的基础能力,但三者发展并不同步。服务器虚拟化率先突破,催生多租户数据中心并引发网络根本性变革。新的接入层随之出现—多数端口变为虚拟接口,由虚拟机管理器内的虚拟交换机而非ToR。

早期虚拟机管理器直接将虚拟机接入物理网络,导致其与底层拓扑和寻址紧密耦合。此时网络本身尚未虚拟化,缺乏在共享基础设施上运行的,具有独立服务模型、拓扑与地址空间的虚拟网络。这造成很大运维挑战:资源调配与迁移需改动物理网络,可扩展性先天受限。

正是此背景下,Nicira于2007年成立,依托NSF资助的斯坦福-伯克利Ethane研究项目。公司融合两大理论基石为企业环境带来网络虚拟化:其一是SDN的控制与转发分离原则,其二是非传统企业网络的虚拟化研究探索。

学术洞察与企业需求的融合催生两大创新:首先是生产级软件交换机。随着运维压力使虚拟交换机成为虚拟机网络服务主入口,物理网络主要承担隧道数据包传输。这种职责分离要求虚拟交换机高度可编程—每个虚拟端口需根据实时配置实现虚拟网络抽象,而非静态对接物理网络。Nicira创建的软件交换机迅速成为全球数据中心网络虚拟化的基石组件。

其次在控制平面:网络虚拟化需要能计算协调全虚拟交换机分布式状态的控制平面,以建立维护虚拟网络抽象。集中控制虽提供灵活性,但实际规模与可用性要求必须引入分布式架构。为平衡此矛盾,Nicira转向分布式系统原理而非传统路由算法,在灵活性与复杂度间取得更优平衡。这一思路最终落地为,首个分布式通用网络资源控制平台,它影响了后续分布式控制器设计,成为SDN商用成功的关键要素。

Nicira将这些创新集成为多租户企业数据中心虚拟化平台。2012年VMware收购Nicira,该平台演进为广泛部署的网络虚拟化产品,持续推动行业变革。

2010年代初期,网络行业开始认识到SDN具有诸多重大优势。它将复杂协议从交换机中剥离并提升至控制平面,通过现代编程语言实现。这使得仅通过检查控制网络的软件及交换机维护的转发状态,即可推断协议正确性成为可能。历史上首次实现了对完整网络行为的形式化验证。

研究者、初创企业、设备商与云巨头纷纷利用SDN原理开发新型网络验证方法。我们特邀深度参与该领域的George Varghese教授分享见解。

From SDN to Network Verification, as recounted by George Varghese

大型企业网络包含路由器、防火墙、负载均衡器等异构组件,即使"谁与谁通信"这类基础可达性问题也难以回答。配置错误可能导致中断或安全漏洞。SDN为构建复杂网络可达性计算工具组提供了概念基础。

除数据与控制分离外,SDN更揭示出:无论以太网或IP等传统层级为何,路由器转发行为均可抽象为数据包头的判定规则。基于同一洞见,Veriflow与Header Space Analysis (HSA)将网络范围的可达性计算推向新高度,开创了网络专属形式化验证领域。HSA最初为分析SDN共享设计的三值代数,后被推广以解答分布式IP网络的数据平面可达性问题。Veriflow经商业化后被VMware收购;HSA由Forward Networks商业化运营十年后,仍为约40家财富500强企业提供服务。

第二代研究中,SDN再次指引方向—从数据平面验证延伸至控制平面验证,在OSPF、BGP等分布式路由协议中实现可达性保证,将集中式SDN控制逻辑推广至分布式环境。此时分析维度需覆盖所有数据包头与路由状态。Batfish最初作为控制平面模拟器开发,如今被75余家大型企业采用。其精密的软件架构使其成为"网络配置领域的LLVM",支撑多款工具开发。

首款跨控制平面环境的形式化推理工具Minesweeper证明,仅需分析BGP等分布式路由算法的稳定状态即可实现验证,逼近集中式SDN控制平面的简洁性。NSF大型项目"Network Design Automation"力图将验证工具扩展至更广网络场景,践行Nick在SIGCOMM 2012主题演讲中提出的愿景。该项目成果Lightyear通过局部性原理将控制平面验证扩展至超大规模网络,获微软Azure采用。SDN帮助学界建立抽象方法与工具,以应对传统协议中更复杂的控制平面。

这些成果均受NSF持续培育:Veriflow与Batfish获多项NSF资助并通过小企业创新计划商业化;HSA受POMI Expedition Award支持;Minesweeper与Lightyear获其他NSF基金。限于篇幅,众多NSF资助的开创性工作未能尽述—但可以说,植根于SDN思想并受NSF滋养,网络验证已成为学界与工业界蓬勃发展的子领域。

软件定义网络(SDN)的一大优势在于,它将控制权从网络设备供应商转移到了软件程序员手中。传统供应商往往采用封闭的专有系统,导致技术演进缓慢;而软件程序员则能通过开源软件自主定义网络行为。这一转变已蔚然成风:如今大多数大型网络均由网络所有者与运营方自主编写的软件控制,而非依赖设备供应商的解决方案。

但硬件层面又如何呢?交换机、路由器、防火墙和网卡均采用高度集成、成本效益好且超高速的专用集成电路(ASIC)构建。问题在于:数据包处理功能(如转发、路由、防火墙及安全防护)所依赖的特性和协议,在芯片设计阶段就已固化在硬件中—这往往比实际部署提前两到三年。若网络运营者需要调整网络行为,例如增加新的流量统计方式或行为验证机制,又当如何?为此,一批研究者和创业者开始致力于让交换机和网卡实现用户可编程,以加速技术迭代并赋予运营者更大控制权。这不仅催生了新型可编程设备,更围绕P4编程语言形成了完整的开源运动。

我们特邀主导P4语言生态系统发展的Nate Foster教授,为您讲述可编程转发平面的诞生历程。

P4 and Networking DSLs, as recounted by Nate Foster

如果说SDN的第一阶段让网络所有者掌握了控制平面,那么第二阶段则进一步赋予了其转发平面的主导权。P4语言("协议无关数据包处理器编程语言")通过专为网络设计的编程结构,使开发者能够自主定义数据包的解析方式、软硬件流水线处理逻辑及转发机制,而非被动接受设备预设的固化行为。如今,P4已发展成为充满活力的开源生态系统,支持包括交换机芯片、智能网卡和软件交换机在内的多类目标平台。它既可用于编程支持P4的硬件,也能对非可编程设备进行功能验证。

P4的语言设计植根于早期学术界对网络领域特定语言(DSL)的探索——这些研究多数获得联邦基金资助。Frenetic语言将函数式响应式编程思想引入SDN,实现了控制平面与数据平面的模块化编程及高层协同。NetKAT语言则通过扩展克莱尼代数与检验理论,为全网转发行为提供了严密的规范定义与推演框架。该语言不仅构建起健全完备的等式理论体系,更基于符号自动机实现了"一键式"验证。这些语言显著提升了编程抽象层级,以全网视角、模块化及可验证的编程范式取代了传统的底层配置操作。

这些理念已在工业界显现影响力:基于意图的网络架构继承了早期SDN领域特定语言的高层抽象思想,NetKAT则被实际应用于云环境隔离策略验证。这一进展折射出网络技术与编程语言研究领域深度协作的成果,而美国国家科学基金会十余年来关键性资助更是重要催化力量:2011年的专项资助支撑了Frenetic与NetKAT的基础研究,2013年举办的网络验证暑期学校则加速了人才培养。后续设立的"现场形式化方法"等基金项目持续推动领域发展,不仅支持NetKAT的概率论扩展,更促进了P4形式化语义及验证工具链的完善。

至此,我们主要探讨了运行于数据中心、企业网和长途广域网中有线(电学和光学线缆)环境的SDN有线网络。SDN最初的设计理念正是基于有线网络架构。

然而,对于全球使用最广泛的蜂窝移动网络而言,技术开放的诉求更为迫切:数十年来,这个领域始终被封闭、私有且复杂的"标准"所束缚,这些标准旨在让设备供应商牢牢掌控市场主导权。SDN技术为打破垄断带来了契机,通过引入明确定义的控制API与接口,将控制软件迁移至通用服务器的标准操作系统之上。

这场变革才刚刚拉开序幕,其源头可追溯至2000年代中期美国国家科学基金会资助的先驱研究,随后又通过美国国防高级研究计划局(DARPA)支持蜂窝基础设施开源软件的项目获得加速发展。我们特别邀请到在开放网络基金会开发开源蜂窝系统、并参与DARPA资助的Pronto项目的Guru Parulkar 和 Oğuz Sunay,为您讲述这段波澜壮阔的技术演进历程。

SDN’s Influence on Cellular Networks, as recounted by Oğuz Sunay and Guru Parulkarg

虽然SDN技术起源于数据中心和骨干网络,但其影响力已向外辐射,重塑了移动网络架构。传统移动网络—从核心网到无线接入网(RAN)—长期以垂直集成、硬件绑定的基础设施为特征,如今已全面拥抱软件定义理念:实现控制面与数据面解耦、部署集中化智能管控、并开放可编程接口。

在移动核心网领域,SDN理念显著体现在3GPP采纳的控制面与用户面分离(CUPS)架构中,该架构使运营商能更灵活地管理业务流和服务功能。这以成为5G基石的技术,支撑了动态用户面部署、流量工程和网络切片功能。此前,网络功能虚拟化(NFV)通过将网络功能从专用硬件解耦、实现虚拟化核心网,为这场变革奠定了基础;随后CUPS进一步解耦架构,以支持SDN风格的可编程能力。而DPDK技术则通过在基于软件的用户面功能(尤其是5G用户面功能UPF)中实现高吞吐、低延迟的数据包处理,加速了这一转型,使得SDN管理的用户面具备大规模实用价值。

当结合SDN管理的传输网络时,5G网络通过双层控制平面(传输层SDN控制与移动层5G控制)扩展了SDN架构,共享的数据平面同时承载5G控制信令和用户业务流量。eBPF等技术的引入,进一步增强了实时流量调度、监控与整形能力—该技术实现了细粒度可观测性和内核内可编程能力。尽管eBPF在原始转发速度上不如DPDK优化,但它支持动态流量整形、负载均衡和带内遥测等演进特性,这对移动数据路径的性能保障至关重要。

曾经固化于专用芯片的无线接入网(RAN)也经历了同步变革。O-RAN联盟定义的开放接口与解耦组件,通过RAN智能控制器(RIC)实现SDN式可编程能力。RIC向第三方应用开放API—近实时微应用(xApp)与非实时微应用(rApp),藉此协调频谱分配、移动性管理与干扰策略,实现AI辅助的服务感知优化。O-RAN的无线单元/分布式单元/集中式单元(RU/DU/CU)三级解耦架构,使SDN控制器能够管理多供应商的异构RAN组件。DPDK在此同样发挥关键作用,为加速前传交换提供支撑,并在软件化RAN实施方案中实现实时数据包处理。

英特尔FlexRAN等平台加速了这一转型。该平台将基带功能与芯片解耦,支持在x86硬件上进行实时软件处理,并通过SDK实现可定制的L1-L3层行为。它已成为众多商用虚拟化无线接入网(vRAN)和开放无线接入网(Open RAN)部署的基石。英伟达Aerial平台则进一步通过GPU加速的RAN处理与AI原生调度技术,将高性能计算与SDN风格的边缘灵活性深度融合。

至关重要的是,这些变革得到了联邦资助科研基础设施的催化。美国国家科学基金会(NSF)的"先进无线研究平台"(PAWR)项目旗下测试平台(COSMOS、POWDER、AERPAW、ARA)为可编程5G核心网与RAN系统的实验提供了支撑。美国国防高级研究计划局(DARPA)通过OFFSET、Mosaic和OPS-5G等项目,探索了战术与自主场景下的软件定义移动网络。尤为突出的是,DARPA的"Pronto项目"基于SDN控制、P4可编程数据平面及端到端遥测技术,在高校校园和运营商测试平台中构建并部署了全栈可验证安全的5G网络。Pronto项目的理念通过开放网络基金会(ONF)的SD-RAN、SD-Core和Aether平台实现产品化,共同构成完整的云管理SDN化4G/5G边缘解决方案。这一技术栈持续运行,并被乐天移动(Rakuten Symphony)采纳为其全球开放无线接入网与边缘核心网部署的核心引擎。

通过持续投入开放实验平台与社区驱动的软件基础设施,NSF与DARPA成功将SDN架构革命推向移动网络的核心地带——将蜂窝系统转变为可编程、高灵活性、支持持续创新的平台。正如全球移动运营商实践所证明,这一转型已切实带来资本性支出与运营成本的双重优化。

结论

美国国家科学基金会(NSF)过去二十年对软件定义网络(SDN)的投资已收获巨大回报。SDN技术彻底改变了企业运营数据中心、企业网、移动通信网络与骨干网络的方式,为创新理念的广泛部署开辟了通路。最终的受益者是全球数十亿用户——他们日常使用的互联网服务因此变得更加可靠、安全、经济且高效。

早在网络运营方(而非少数传统设备供应商)自主定义网络行为还被视为天方夜谭的初期阶段,NSF就前瞻性地投入了SDN基础研究。历经多年培育,NSF成功激发了学界与产业界对SDN的持续关注,催生了充满活力的研究社群、关键性软件基础模块以及推动SDN技术落地应用的早期初创企业。实践证明,互联网乃至整个计算与通信技术领域的发展,正需要NSF这种推动颠覆性变革、培育持续创新活力的战略远见。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容