1.微软
主要产品:AI助手Copilot(openAI);Copilot+
2C:与bing、桌面、浏览器结合,增强搜索、聊天、购物等体验
2B:提升工作效率\转化工作想法: Microsoft Copilot for Microsoft 365/Sales/Service/; GitHub Copilot
GPU:Azure Maia GPU,台积电5nm节点工艺,拥有1050亿个晶体管的单片芯片,算力可与竞品媲美,网络IO方面领先,显存带宽略输竞品
CPU:Azure Cobalt100 CPU共有128个核心,并支持12条DDR5通道
2.亚马逊
主要产品:推出Olympus大模型,升级Alexa语音助手;Olympus+
电商业务:引入AI,提升了用户的购物体验和转化率
AWS云服务:推出人工智能服务bedrock计划,迭代内部大模型
推出CodeWhisperer等AI工具,协助编程人员
GPU:训练端ic诉求在于降本,最新的Trainium2预计与英伟达H100对标竞争;推理端ic:Inferentia
CPU:新推的Graviton4性能至少比上一代提高了30%,比同类芯片少用60%的电来完成相同的工作负载
3.苹果
推出MLX框架,支持统一内存,大幅提升端侧模型量级,预计2024年推出的iphone16系列及MaC系列均将受益,增加GenAI模块,2024年年初推出第一代MR产品Vision Pro
IC:为AI优化自研Apple Silicon芯片
神经网络框架:发布新的神经网络机器学习框架MLX
Ajax苹果的大模型
将生成式AI整合到Xcode开发工具中
端SOC芯片:发布适用于M系列IC的新的神经网络机器学习框架MLX,支持“统一内存”提升本地运行的模型参数量级
4.谷歌
主要产品:AI助手Duet AI;推出多模态Gemini;Duet AI+;增加Gen AI功能的Pixel系列手机
搜索:推出Search Generative Experience(SGE),将AI结果直接与google搜索结合
广告:增加了AI的功能模块
Workspace:类似office
端侧:pixel系列加入AI功能
TPU:全新的面向云端AI加速的TPU v5p,每个TPU v5p Pod由多达8960个芯片组成,使用最高带宽的芯片间连接(每芯片4800Gbps)进行互连
端SOC芯片:Tensor G3,应用于pixel8系列,加入更多AI功能
5. Meta
合作推出Meta Ray-Bans智能眼镜,开始测试多模态AI;持续推出Meta Quest系列产品,Quest3实现MR与VR切换;2024年,可能会展示一款代号为“Orion”的超前AR眼镜原型
社交:将Reels短视频接入Meta AI的聊天界面,完善Facebook、Instagram、WhatsApp等平台的AI生态
广告:应用AI提升广告投放的效率,更新客户的投放模式
MTIA是Meta第一个针对推理工作负载的内部定制加速器芯片系列
MSVP是Meta为内部开发的第一个用于视频转码的ASIC
Meta超算中心RSC具有16000个GPU,所有GPU都可以通过三级Clos网络结构访问
6.特斯拉
主要产品:以完全自动驾驶为目标,构建神经网络算法、自动驾驶推理型FSD芯片等;推出更具AI功能的智能驾驶电动汽车
算力复用于智能机器人tesla bot
采购大量英伟达芯片的同时,布局自主训练ic Dojo