7月4日,在2019百度AI开发者大会上,百度携手三大运营商、浪潮、英特尔等联合发布了百度AI边缘计算行动计划和《AI边缘计算技术白皮书》,白皮书系统阐述了5G时代边缘计算与AI结合的广阔应用场景,以及技术策略。本文为白皮书的第一部分“边缘计算的总体思考”。
发展趋势和需求
互联网服务市场纵深发展,带来了信息流量和计算需求的巨大的变化。根据多家机构 预测, 5G将进一步刺激视频类富媒体流量的发展,移动视频流量每年增长45%,到2023年占总体移动数据流量的73%。全球互联网数据逐年提升,2020年将达到 40ZB,其中40%流量都将由物联网产生,进而带来了数据分析和处理方面的极大需求。
边缘计算能够在靠近用户或数据源的位置提供网络、计算、存储服务,不仅能够实现 流量的本地化处理,降低对传输网络和远端数据中心的流量冲击;而且能够提供低时延和高稳定的应用运行环境,有利于计算框架在终端和数据中心间的延展,有助于实 现场景需求、算力分布和部署成本的最佳匹配。边缘计算将满足消费者和产业互联网市场的如下需求。
一、边缘计算是更新消费者互联网体验的重要保障。
•视频消费再升级:一方面,消费者期待更高画质、缓冲零容忍的观看体验。从 1080P到4K/8K,从30帧到60/120帧,更高画质和流畅度不断刷新消费者的观看习惯,而画质每一个等级的提升都将带来流量带宽3〜4倍的增长。另一方面,视频正朝着沉浸式和强交互服务方式发展。360度全景、视频社交化推进视频流向多路和实 时性方向演进。边缘计算能有效避免大流量对长途网络的资源抢占,确保从视频源到 消费者的低吋延、大带宽和高可靠。
•场景化AI能力普及:AI能力已成为多数终端的默认配置。从简单图片处理到AR 渲染,再到复杂的媒体编辑,AI能力丰富了应用的交互手段,同时也拓宽消费者对于 信息编辑和创造的想象空间。而不受时间、空间、和终端类型限制,为用户持续提供充足的AI算力则是智能化应用发展的趋势。边缘计算能够克服终端在功耗、存储容量 等方面限制,兼具云端强大算力和本地端超低时延的优势,将为AI应用加速推广奠定更坚实的基础。
•消费者多模交互:物联网、5G技术推进了万物互联,更多兼具计算及存储功能的设备联网,智能穿戴、网联车载娱乐、AR/VR眼镜、无人机等连接设备的种类逐年增加。智能手机与消费者间交互时间将被多种终端分摊,消费向多模化方向发展。多模交互 不仅带来了信息供给多元化,特定终端交互方式也对性能参数带来了极致要求,例如VR应用20ms以内的吋延要求。边缘计算在满足多元应用性能要求的同吋,也能通过分摊终端计算和存储能力的方式来实现终端设计轻量化的要求,进而降低终端成本、 优化终端体验。
二、边缘计算是产业互联网发展的必要基础设施。
•传统产业的数字化和网络化:2019年政府工作报告提出了新旧动能接续转换,包 括传统产业升级、产业互联网构建、产业级的数字生态。其一,传统产业网络化加速了数据激增,例如智能交通在路边铺设高精雷达和多组摄像头,联动自动驾驶车辆来 提高交通信息的精准抓取和高精模型建立,由此将带来TB级数据的产生。算法、算力的就近部署是这类产品规模化部署的基本要求之一。其二,产业数据的数字化及传 播对信息安全提出更高挑战。私有化数据的不出网和安全保障需要边缘计算设施作为 防护来达到部署的基本要求。
•基础设施共享、产业中台:为了最大化实现互联网技术对传统产业的赋能和效率提 升,信息技术需要与行业诉求进行深度融合。通过数字化功能内嵌和产品软件化,实现智能化发展。边缘计算是产业互联网所依赖的重要资源,边缘计算平台带来的效率 提升也将辐射到产业互联网的生产流程,带动数字化、流程化和平台服务发展。当前 边缘计算平台化开源软件的持续升温,能够极大促进未来产业化平台效能提升。
•数字产品向传统产业渗透和融合:传统产业向互联网方向的发展需要维系数字产品 与生产环境需求的内在联系。智慧城市、智慧交通、智慧农业、AI安防等数字化产品也需要合理部署资源,才能服务于传统产业。边缘计算既满足了传统产业对部署安全 等诸多方面的要求,通过平台化技术又能高效地满足数字化产品所需的部署环境。因 此,边缘计算将促成数字世界与物理世界互动、融合,实现技术和市场的相互促进。
定义及技术体系
综合应用对于计算能力、时延和稳定性的要求,根据计算所执行位置和产品属性来分类,边缘计算可分为三类形态:
•物边缘:数据源自身具备计算能力,如智能手机、计算卡、智能摄像头等。由于在数据源本地处理计算请求,虽然响应时延低和稳定性能达到最优,但受限于功耗、物理资源等因素,一般仅完成简单计算任务。
•移动边缘:伴随5G网络发展而产生的新兴边缘计算资源,服务能配合5G终端、无线基站实现最佳边缘位置的布放,并结合5G能力开放可获得、定义无线带宽、 网络切片、终端位置等增强功能。
•云边缘:在现有云服务中的CDN节点资源上,通过增加计算型服务器资源,在原有的流量加速服务上开展函数计算、AI智能服务等功能。
图1 边缘计算资源形态
以上三类边缘计算资源在场景设计、计算任务、产品属性和资源就绪程度上各不相同。在处理复杂AI计算任务上,需要能够集中各自资源优势,实现计算任务和相应资源匹配,才能取得总体最优的效果。
图2 边缘计算技术栈
为了达到这样的效果,边缘计算技术体系需要兼具物理资源属性调优、平台逻辑资源 优化和高效计算任务框架,实现硬件和软件层最佳融合。如图2所示,技术体系分为物理资源及加速、laaS平台资源管理、PaaS服务、AI算法框架和应用服务五部分内容。
•边缘计算物理资源:物理资源分为智能终端、移动边缘计算站点和云边缘站点,根 据不同资源程度来分配计算任务。三类资源通过接入侧或广域侧网络技术完成节点资源的连接。接入侧网络包括4G/5G、固定接入、物联网或LAN技术,完成端计算到 其他边缘站点资源的连接。广域侧通过P〇P点完成数据中心云端到移动边缘/云边缘站点的连接,保障边缘与云端的网络质量。
•物理资源加速:完成了以上边缘节点本地计算、存储、I/O优化和节点连接的加速 优化。端节点通过FPGA等硬件加速技术为AI推理计算提供良好的性能环境。移动边 缘和云边缘站点在适应功耗要求下通过AI芯片、存储优化、高速I/O框架实现加速和 效果提升。此外,边缘节点间连接加速可通过5G切片、QoS调优或SDN-WAN等 完成节点间连接的加速功能。
•平台资源管理:资源管理实现对CPU/GPU、存储和网络的虚拟化、容器化和池化 功能,满足资源的弹性调度和集群管理要求。同时,平台将完成租户隔离、安全保障、镜像仓库、日志存储等资源层面服务的供给。
•PaaS服务:面向服务提供三个阶段功能,一是应用设计及开发阶段的微服务化,通过微服务框架完成微服务模块间依赖关系绘制和模块到边缘计算资源的服务编排。二是提供服务的运行态环境和通信框架,例如业务发现、MQTT、RPC等为服务运行 提供框架性的功能支持。三是对于服务CI/CD和运行状态监控等管理面服务支持。
•AI算法框架:从延迟、内存占用量和能效等方面,进行边缘计算节点上AI推理加速和多节点间AI训练算法的联动,完成轻量级、低时延、高效的AI计算框架。边缘设备需要执行越来越多的智能任务,例如智能驾驶需要街道目标检测识别,语音助手需要自然语言的理解。针对实时信息输入,AI算法需要执行预测处理、及时响应输入。此外,针对信息安全、数据不出网等要求,边缘节点需要完成数据安全预处理,边缘 -云数据中心协同才能开展完整的AI模型训练。以上操作配合CV、NLP等AI算法模 型库和强化学习、迁移学习等工具组件,形成完整的AI算法框架。
•AI应用:边缘节点应用对计算和流量带宽处理存在较强依赖。计算方面,应用需要AI算法框架完成人机交互、编解码/加解密等算法框架进行信息预处理、交通/医疗 等建模算法构建专业领域信息框架,同时PaaS提供了“writeonce, run everywhere”的友好环境。流量方面,边缘节点需要数据源带宽低收敛比、低时延响应的物理资源环境,以满足数据传输和交互需求。
边缘计算技术特性
从物理特性和逻辑特性来总结边缘计算的技术特性。
物理上,边缘节点具有近源端、安全亲和、结构扁平和基础设施规格化特征。
•低时延和流量本地化:靠近数据源所带来的低时延和高带宽是边缘计算节点的本质优势,具备多接入(Multi-access)特性的边缘计算会将这种技术优势惠及到不同类型的数据源上。
•安全亲和:在工业、交通、医疗等行业应用上,对数据安全、网络安全、信息安全的保障是边缘计算开展的必要条件和服务场景,边缘节点资源安全布放是相关场景开展的基础。
•计算扁平化:边缘计算使智能化进一步普及,算力可随着边缘节点资源得以延伸, 实现了计算的去中心化和无边界化。
•基础设施规格化:不同的应用场景,对基础设施的要求也不相同。为提高应用部署效率,需对基础设施部署统一规格。规格化的定义可从部署安装环境、I/O及加速部件可扩展性、高温/高湿环境适应性、故障管理和设备易维护等几个方面来定义。规格化定义有助于从设备供应、安装部署、运营维护和故障恢复等形成一系列产业建 议,促进生产链成熟。
逻辑上,边缘节点具有场景化、软件友好和服务标准化特征。
•场景化和智能化:边缘计算由于所覆盖人群和区域的定向性,由此也衍生了服务场景化,例如服务于工业、园区、交通等边缘在服务开展上具有鲜明的行业特征,智能化也可以根据服务场景做定向算法优化和AI赋能。
•软件友好:边缘服务是云服务的延伸,是现场服务的扩展,是整体软件服务一环。通过边缘计算PaaS框架屏蔽底层硬件差异和资源平台差异,实现云-边-端服务软件 统一部署。
•服务标准化和模板化:服务快速部署和弹性运维是开展规模化边缘计算服务的前提,这也要求对典型边缘计算场景和算力、带宽等资源进行标准化和模板化设计,实现快速复制和拓展的效果。
边缘计算网络部署模式
为了适应不同行业差异化诉求,边缘计算在行业中的落地会存在多种部署形式,每一 个最终落地的边缘网络的组网架构与所覆盖的业务/网络需求、管理和运营模式以及商业模式相对应。下面归纳出了三大类典型的边缘计算网络部署模式。
•企业私网:此模式针对有很强的对网络自主可控的企业诉求,将完整网络数据面和 控制面完全部署在企业私有环境中并交由企业自己管理。例如,在企业内部提供端到端的无线网络及其完整的控制面部署。专用网络与公共网络之间完全相互隔离,这样 最大程度上保证了企业数据和网络环境的隔离和独立性,但是同时对企业自身的网络 管理能力也提出了较高的要求。
•园区专网:在数据面上满足企业私有化部署要求,控制面复用公共部署资源。例如,5G部署时,可以将用户面网关(SGW-U/UPF)部署在临近企业现场位置,而 5G控制面功能(AMF/SMF/PCF等)[2]仍使用网络运营商资源。又或者,云服务提 供商为企业部署现场数据面处理功能,满足数据不出网等安全需求,而AI模型训练等离线控制功能仍使用云服务提供商资源。此模式既能确保企业的安全诉求,又能最大 化复用公共运营商在资源管理和编排方面的能力,对技术轻量化运营的企业(如以园 区为单位的一定数量的中小企业单位)不会产生过高的维护能力的要求。此外,该模式下公共服务运营商可以同时兼顾园区内边缘计算特定需求又能保证公网业务不受影 响,这种模式很可能会成为边缘计算网络面向园区类市场的典型部署模式。
•切片组网:数据面和控制面均使用公共服务运营商的资源,通过划分专有的网络或 资源隔离来实现专用化资源的供给。例如,5G采用网络切片技术提供资源隔离的逻辑 网络。根据业务需求结合边缘计算来提供差异化的切片服务,构造逻辑上专用的网络,而物理资源则完全纳入公共运营商的统一调度。对于地域跨度大、且需要特定 SLA保障的服务场景,切片组网是一个理想的解决方案。当然这种模式需要公共服务运营商对目标市场的判断和相应边缘计算网络资源的部署规划都提出了极高的要求,
这也需要服务供需双方、设备提供商等产业各方共同探索来得出最佳实践。