姓名:万雪曼;学号:21000500024;学院:电子工程学院
加码AI市场 英特尔发布新一代AI计算芯片Gaudi2
参考链接:https://3w.huanqiu.com/a/c36dc8/47xi4ieziFt
【嵌牛导读】5月10日晚间,在英特尔On产业创新峰会(Intel Vision)上,在英特尔On产业创新峰会上,英特尔正式发布了新一代的高性能深度学习AI训练处理器Habana Gaudi2。Gaudi2是英特尔旗下Habana Labs的第二代AI处理器,其运算速度是Habana Labs之前芯片的两倍。
【嵌牛鼻子】高性能深度学习AI训练处理器;支持多样化架构
【嵌牛提问】Gaudi 2处理器是专为人工智慧(AI)深度学习应用而设计,与拥有CUDA的英伟达,谁的使用效率更胜一筹?
【嵌牛正文】
早在2019年12月,英特尔就以20亿美元收购了为数据中心提供可编程深度学习加速器的厂商Habana Labs,进一步增强了英特尔的人工智能产品组合。
Habana Labs的第一代Gaudi处理器是一款可编程且可定制的AI处理器,搭载基于第二代Tensor处理核 (TPC) 并集成开发工具、库和编译器。基于ResNet-50,Gaudi可以提供每秒1650张的图片处理能力——这是在业界单一处理器中最高的计算能力。同时,Gaudi的创新架构可以实现训练系统性能的近线性扩展,即使是在较小Batch Size的情况下,也能保持高计算力。这意味着,基于Gaudi处理器的训练性能可以实现从单一设备扩展至由数百个处理器搭建的大型系统的线性扩展。
和英伟达的V100相比,基于ResNet-50基准测试,Gaudi所表现出来的计算性能、功耗比和延迟时间仍然相当出色,在速度上要比V100快3.8倍。比如,在性能方面,V100单卡大概每秒处理600多张图片,而Gaudi单卡则可以处理1600多张;在功耗方面,V100处理600多张图片的功耗达到了300瓦,而Gaudi处理1600多张图片的功耗只有150瓦左右。
除了性能,Gaudi处理器片上集成了 RDMA over Converged Ethernet (RoCE v2) 功能,能够让人工智能系统使用标准以太网扩展至任何规模。
此次发布的Habana Gaudi2,在深度学习实现重大飞跃:专用于高性能深度学习AI训练的Gaudi处理器,能够让客户以较低成本进行更多训练。