一、 算力的竞赛
需求端:AI 拉动成长,算力需求空间广阔
2022 到 2023,全球 AI 布局加速,大量人工智能模型涌现。2022 年 11 月,OpenAI 发 布聊天机器人 ChatGPT,将生成式 AI 的燎原战火带入公众视野。2023 年 2 月,Meta AI 在其官网公开发布了 LLaMA 大型语言模型。2023 年 5 月,Google 发布新一代大语言模 型 PaLM 2。与此同时,中国科技企业也按下了 AI 领域的快进键。百度于 2023 年 3 月 发布文心大模型。此后,商汤、阿里云、科大讯飞、华为等陆续发布各自的大模型。

大量人工智能模型的推出和迭代大幅带动了上游的算力需求。一方面,全球人工智能模 型数量的增长对上游算力需求的拉动十分显著。另一方面,单个模型的持续迭代过程中, 其算力需求较以往亦有大幅增长。以 GPT 系列预训练过程为例,历代 GPT 参数量呈现指数级增长,未来其算力需求有望 大幅增长。训练一次 1750 亿参数的 GPT-3 模型需要的算力约为 3640 PFlop/s-day,约合 3.14E23 FLOPs。但这算力消耗速 度很快被新一代模型刷新。GPT-4 不仅支持文本输入,还支持图像输入,文字输入限制 提升至 2.5 万单词,所需计算规模大幅提升。

历代 GPT 系列的参数量和预训练数据量
算力需求提升,意味着芯片、服务器、云厂商和运营商等各个环节的需求增长。根据中 国信通院《中国算力发展指数白皮书》测算,2021 年全球计算设备算力规模超过 615EFLOPS(1 个 EFLOPS 代表 10^18FLOPS),同比增速高达 44%左右,而后续几年则 将迎来算力引爆时代。信通院报告预测,2030 年,全球算力规模有望达 56ZFLOPS,2022- 2030 年复合增长率达 65%。这对于 AI 芯片需求的拉动将会非常显著: 一方面,从服务器总量上来看,算力需求增长将带动 GPU 服务器出货量增速高升, 从而带动训练芯片的需求; 另一方面,从服务器结构上来看,相比较普通 GPU 服务器(一般配备单卡或双卡), AI 服务器平均每单位出货所需的 GPU 数量至少翻倍(一般配置 4 块以上 GPU 卡)。
供给端:算力竞赛激烈角逐
从 AI 芯片的市场格局看: GPU 核心供应商包括了 NVIDIA、AMD 等,NVIDIA 目前占据大部分市场。 FPGA 供应商主要包括 Intel、赛灵思(AMD)等,其中赛灵思于 2022 年被 AMD 收 购。 ASIC 市场较为分散,比较知名的供应商例如设计生产 TPU 的谷歌。 随着 AI 技术的迭代、算力需求的增长,各家芯片企业亦展开了百舸争流的竞争态势
在 GPU 市场,英伟达凭借以 H100 为首的高性能 GPU,率先卡位。;AMD:GPU 加速追赶英伟达,并快速布局 FPGA;谷歌:TPU 不断迭代,TPU v4 性能优秀;英特尔:提升 FPGA 推新频率,Gaudi2 性能强。

二、 大模型
随着大模型能力的持续迭代、应用端需求的不断增加,模型能力对外输出的需求带来了 MaaS(Model-as-a-Serivce)服务生态的形成。 以微软为例,微软云是 OpenAI 的独家云提供商,微软 Azure OpenAI 可以直接调用 OpenAI 模型,企业可以申请访问包括 GPT-4、ChatGPT、Codex 以及 DALL.E 等模型, 根据用量进行商业化收费。

AI 模型输出的需求将带来MaaS 业态的持续增长。不论是通用大模型、还是行业模型,其模型能力的输出都会带来 MaaS 服务需求的增加。
三、同质化的竞争?
1、大模型:从基模型到行业模型,模之战斗开启
随着 OpenAI 等先行者的突围、LLAMA 等模型的开源,当前国内外大模型产品如雨后春 笋一般层出不穷。

中国《人工智能大模型地图研究报告》显示, 据不完全统计,国内 10 亿级以上参数的大模型已有70+个;

尽管各家模型企业在算力资源和数据资 源上存在差别,但多数模型本身可能并不存在绝对的差异化。正如北京智源人工智能研 究院院长黄铁军表示,“大模型发展中没有绝对的壁垒和护城河,有了大模型就像人类多 年前学会了发电,后续还会有各种各样的‘发电手段’不断演进迭代”,“大家比拼的是 成本和效率,竞争的是应用和生态”。
2、问题:若模型同质化,MaaS 壁垒何在?
伴随着大模型的层出不穷,云厂商们提供的 MaaS 服务也在积极开展。 国际云服务巨头提供的 MaaS 业务模式,按照合作模型方的数量可以归为两类: 接入独家模型:如微软 Azure 绑定 OpenAI,则 AzureOpenAI 所能提供的 MaaS 能 力优劣大幅取决于 OpenAI 的模型能力。 接入多个模型:如亚马逊 AWS 推出 Amazon Bedrock,通过 API 可访问 AI 21 Labs、 Anthropic、Stability AI、Amazon Titan 等不同的模型。再如,Salesforce AI Cloud 托管了 AWS、Anthropic、Cohere 等不同合作伙伴的 LLM 模型。 当然,从模型厂商——如 Anthropic 和 Cohere——的角度,模型企业也乐于与多个 云服务平台展开非排他的合作。

从国内巨头近期的动作上看,打造开放的、多模型来源的模型商店,也是 MaaS 服务越 来越常见的模式。以字节跳动的火山方舟为例,其集成了百川智能、出门问问、复旦大 学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI 等多家 AI 科技公司及科研院所 的大模型,并已展开测试邀请。

未来“多模型”将成为 MaaS 平台的重要合作模式,而 MaaS 平台之间的产品相似性也会越来越高,MaaS 服务将成为基础设施。从长期角度,除了算力等资源外,精细化运营程度、价格等因素可能成为 MaaS 平台的核心竞争力。