姓名:吕烜威 学号:20021210973 学院:电子工程学院
【嵌牛导读】CPU,是IT行业的制高点,既是各大IT公司角力的主战场,背后还是各国政府科技竞赛的竞技场,40年江湖,你方唱罢我登场,好不热闹。在进入CPU时代前的史前时代, 是计算机从发明到大发展的计算机时代, 包含机械计算机、电动计算机、电子管计算机、晶体管计算机、集成电路计算机等几个次世代, 这是一个属于IBM的光辉时代, 也标志着人类进入电脑逐步解放人脑的智能时代。
【嵌牛鼻子】处理器 ARM 计算机 ARMv9指令集
【嵌牛提问】ARMv9指令集的发布带来了哪些影响?
【嵌牛正文】ARM两大全新平台诞生:性能飞跃4倍!
3月底,ARM正式发布了ARMv9指令集,号称十年来最重要的创新,在兼容现有ARMv8的基础上,重点强化了安全性、矢量计算、机器学习、数字信号处理,同时继续加强性能,IPC提升幅度高达30%。
现在,ARM又发布了第一个基于ARMv9指令集架构的平台“ARM Neoverse N2”,在安全性、能耗、性能等方面都有全面的提升,可为新一代基础设施核心铺平道路。
Neoverse N系列平台最为注重性能的扩展性、平衡性,特别针对单位功耗、单位面积的性能,以及单位功耗、面积的核心数。
相比主要搭档7nm工艺的上代平台N1,新一代N2最佳搭档是5nm,两相对比在保持相同水平的功率、面积效率的基础上,N2的IPC同频性能(约等于单线程性能)可提升达40%,而频率也可以提高10%。
N2平台可以横跨从高吞吐量计算到功率与尺寸受限的边缘、5G应用场景,且性能提升明显,例如在云端上提升1.3倍的NGINX,在5G和边缘应用上提升1.2倍的DPDK数据包处理,以及提升1.4倍的SPECint2006。
N2平台内部集成了ARMv9.0-A CPU核心、指令集单元、64KB一级指令缓存、64KB一级数据缓存、512KB/1MB ECC二级缓存、异步桥接(Async Bridges)、AMBA 5 CHI直接连接、CoreSight等模块,微架构全方位改进,重点增强基准测试、实际服务器工作负载。、
而在外部系统连接中,它可以支持DDR5内存、PCIe 5.0总线、HBM3高带宽内存,等等。
N2还是第一个具备SVE2功能的平台,可为云到边缘的性能效率带来巨大的提升,比如机器学习、数字信号处理、多媒体、5G等场景中,还具备编程简易性、可移植性等优势。
SMT同步多线程是如今处理器架构设计的一个核心要素,不过另一方面,在云端等共享环境中,专属内核可以提供更具可预测性、确定性的性能,而且更有利于抵御常见的侧信道攻击,这也是N2的理念。
同时,它维持了相同的功耗、面积效率,加入了性能定义功耗管理(PDP)。
N2平台起步就是32核心32线程,最多可以做到128核心128线程,对比N1平台翻了一番,同时比传统架构的64核心128线程更具竞争力。
生态方面,Marvell美满电子已经发布了基于Neoverse N2平台的OCTEON系列网络解决方案,预计2021年底前试产,相比上代性能提升高达3倍。
阿里云在即将上线的Arm架构ECS实例上已经完成测试,SPECjbb测试数据表现惊艳,而且基于ARM架构运行的DragonWell JDK性能提高了 50%。
腾讯也在硬件测试和软件支持方面持续投入,云应用上已经可以采用ARM Neoverse技术。
同时,ARM今天还发布了全新的计算平台“ARM Neoverse V1”。
这是ARM设计的第一个支持SVE(可伸缩矢量扩展)的内核,可为高性能计算、机器学习带来大幅度的性能提升。
ARM N系列是注重平衡性、高能效的平台,ARM V系列则是追求极致性能,具备更大的缓冲、缓存、窗口、队列设计,拥有更大的带宽、面积、功耗。
基于性能至上的理念,V1平台创造了ARM迄今为止最宽的微架构,可容纳更多运行指令,支持高性能和百万兆级计算,再加上SVE功能,V1在单核性能上优势十分明显,全方位碾压N2平台。
而在强化单核性能的同时,V1平台也支持强大的多核心扩展,最多可以做到96核心96线程,工艺上可以使用7nm、5nm,还支持DDR5内存、PCIe 5.0总线、HBM2e高带宽内存、CCIX 1.1互连标准等。
ARM V1平台仍然基于ARMv8.4-A CPU指令集,不过整体架构、模块组成和基于ARMv9指令集的非常类似,有诸多相通之处,同时也有全方位的微架构改进,针对基准测试、服务器/高性能计算工作负载的全面增强,当然也不会不计代价地拉高功耗,同样在电源、功耗、发热管理方面做了强化。
相比于N1,作为Arm强调性能优先的新型计算系列的第一个平台,V1带来了50%的性能提升、1.8倍的矢量工作负载优化、4倍的机器学习工作负载优化,可以灵活地为高度依赖CPU性能、带宽的应用构建强大的计算能力,SoC设计也非常灵活。
生态方面,法国芯片公司SiPearl、韩国电子通信研究所(ETRI),都在打造基于V1平台的高性能SoC。
印度电子信息技术部(MeitY)夜间采纳V1平台,打造国家级百万兆级高性能计算项目。
另外,ARM今天同步发布了Arm Neoverse CMN-700,这是业界最先进的Mesh网格互连技术,能充分发挥V1、N2平台的性能、能效优势。
在上一代CMN-600的基础上,CMN-700在每个矢量上都进一步提升了性能,包括核心数量、缓存大小、附加内存及IO设备的数量和类型等等。
另外,还记得吗?月初的GTC大会上,NVIDIA宣布推出自研的ARM处理器Grace,这是一款面向数据中心的高性能处理器,性能会非常强大,将用于制造2千亿亿次超算“ALPS”(阿尔卑斯山)。
NVIDIA押注ARM处理器也是近年来的一个趋势,ARM架构已经开始侵蚀高性能计算市场,跟x86抢地盘了,前不久ARM还推出了全新的ARMv9指令集架构,官方处理器Neoverse N2的单核性能提升40%,频率提升10%,最多可以做到128核256线程。
ARM来势汹汹,那AMD是否会重新进入ARM市场?毕竟前几年AMD可是把ARM视为重点来抓的,还自研了K12 ARM处理器,可以兼容x86平台。
在昨天的财报会议上,AMD CEO苏资丰也回应了分析师有关ARM处理器的提问,她表示AMD对ARM很熟悉,同时把ARM公司视为重要合作伙伴,会在自己的产品上使用ARM IP核心。
不过苏姿丰表示,如果说到特定的定制ARM产品,那AMD现在没有。
如果是说AMD是否应该做半定制ARM设计,那答案也是肯定的,毕竟这就是半定制业务的意义。
苏姿丰表示,这个问题不是ARM与x86的竞争,更多地是看在满足客户需求的过程中使用正确的IP核心,这就是我们看待ARM的立场。
苏妈的回答非常官方,滴水不漏,简单来说她的意思就是ARM之前尝试过ARM处理器,但是现在不打算自己做ARM处理器了,毕竟自家的高性能Zen架构在各个市场表现都很好。
当然,苏妈也没把话说死,暗示如果客户有需求,那AMD也可以在半定制处理器上集成ARM的IP核心。
哦对了,NVIDIA对于ARM的收购,看起来非常麻烦,很悬。
在前不久的GTC 2021大会上,NVIDIA CEO黄仁勋还表示400亿美元收购ARM一事进展良好,相信各国会放行这笔交易。
不过这几天传出了不太好的消息,英国政府也发出了公共利益干预通知(PIIN),确认会基于国家安全干预这笔交易。
英国方面现在只是表态会干预收购交易,尚无明确的同意或者拒绝,但是此举已经给NVIDIA收购ARM蒙上阴影。
英国方面提出干预是很正常的 ,ARM虽然在2016年就卖给了日本软银,但总部依然在英国伦敦,重要的研发中心、技术人才也都来自于英国,考虑到ARM CPU未来在移动、PC及数据中心市场的重要地位,英国不会轻易让它被外国公司掌控。
NVIDIA原本预期在18个月内完成收购,但是英国此番表态之后,花旗银行的分析师们也在重新思考这件事,最新报告中指出这次的收购交易接近失败,因为NVIDIA前不久推出了自己的数据中心处理器Grace,此后被各国批准的可能性只有10%了。
NVIDIA的Grace处理器细节还没公布,但性能非常强大,又有先进的连接技术加持,配LPDDR5X内存可提供超过500GB/s的带宽,而且支持ECC错误校验,通过缓存一致性NVLink总线连接自家GPU,带宽可超过900GB/s,同时两颗CPU之间的带宽超过600GB/s。
当然,花旗这份报告并非单纯唱衰NVIDIA,反而是认为在没有ARM的情况下,NVIDIA会发展的更好,销售自己的CPU产品要比授权IP更有钱赚。