软件 + 服务 = AI?
AI是被炒作得最多的技术了。在媒体的渲染下,AI似乎无所不能,将来必定无所不在。但是做AI的生意却未必像你想象的那般容易。从传统意义上讲,当今大部分的AI系统都完全属于软件。其结果是,人工智能业务看起来并不完全像软件业务。这门生意牵涉到不断的人力支持以及显著的可变成本。其可扩性一般没有我们希望的那么简单可以实现。而强大的防御能力似乎不是免费就能取得的。知名风投机构A16Z的Martin Casado和Matt Bornstein对AI的商业进行了深度剖析,并为AI创业公司提供了有用的建议。
就技术层面而言,人工智能似乎是软件的未来。人工智能在一系列棘手的计算机科学问题上都展现出惊人的进步,而且软件开发人员的工作正在发生根本上的变化,他们对数据上的投入正在变得跟对源代码的投入一样多。
许多AI公司(和投资者)都在押注,他们赌的是这种关系将不仅局限在技术上——AI业务也会类似于传统软件公司。根据我们跟AI公司合作的经验来看,我们还不太确定。
我们坚信AI的力量能够推动业务转型:我们用资金投入来支撑这一观点,而且我们会继续对应用型AI公司和AI基础设施进行大量投资。但是,我们注意到,在很多情况下,人工智能公司的经济结构与软件业务相比有着根本的不一样。有时,它们甚至看起来更像传统的服务型公司。尤其是,许多AI公司具有以下特征:
由于大量使用云基础架构和不间断的人工支持,导致公司毛利率下降;
由于棘手的边缘案例问题给扩展性带来挑战;
由于AI模型的商品化以及数据网络效应带来的挑战,护城河的可防御性变弱。
有趣的是,在AI公司的财务数据里面我们看到了一个出乎意料的一致模式,即这类公司的毛利率通常在50-60%的范围之内——远低于同比SaaS型业务60-80%以上的基准。早期阶段的私人资本可以在短期内掩盖这些效率低下的情况,特别是在一些投资者更重视推动增长而不是盈利的情况下。但是,尚不清楚任何数量的长期产品或投放市场(GTM)优化能不能彻底解决这个问题。
就像SaaS 跟本地软件相比是引入了一种新颖的经济模式一样,我们相信AI正在创造一种在性质上全新的业务。因此,本文将探讨AI公司与传统软件公司的不同之处,并就如何解决这些差异分享了一些建议。我们的目标不是给出规范,而是为了帮助运营商和其他人了解AI的经济和战略前景,从而可以建立更具持续性的公司。
但是,我们注意到,在很多情况下,人工智能公司的经济结构与软件业务相比有着根本的不一样。有时,它们甚至看起来更像传统的服务型公司。
软件(包括SaaS)的魅力在于它制作一次就可以卖很多次。这种性质创造出大量引人注目的业务收益,包括经常性收入来源,极高的毛利率(60-80 %+),以及(相对罕见的情况下,如果出现网络效应或规模效应的话)超线性的增长。软件公司还具有树立强大的防御性护城河的潜力,因为它们拥有自身所产生的知识产权(通常是代码)。
另一个极端则是服务业。每上一个新项目都需要专门的人,而且只能卖一次。其结果是,收入往往是非经常性的,毛利率较低(30%至50%),而且规模增长就是最好结果了。其防御性更具挑战性——往往要靠品牌或者既有的会计控制——因为客户不拥有的任何IP都不太可能具有广泛的适用性。
人工智能公司似乎正在把越来越多的软件和服务要素结合在一起。
大多数AI应用看起来感觉都跟普通软件很像。他们依靠常规代码去执行诸如跟用户交互、管理数据或与其他系统集成之类的任务。但是,这种应用的核心是一组经过训练的数据模型。这些模型解释图像、转录语音、生成自然语言并执行其他的复杂任务。维护这些应用有时候感觉更像是服务业务——需要大量的,针对特定客户的工作以及输入成本,其程度已经超过了典型的支持和成功函数。
这种动态会以多种重要的方式影响AI业务。在以下各节里面,我们会探讨其中的几种——毛利率、可扩性以及可防御性。
人工智能公司似乎逐渐把软件和服务的要素结合到一起,无论是从毛利率、可扩性以及可防御性来看,都可能代表着一种全新的商业类型。
毛利率,第1部分:云基础设施对AI 公司来说是一笔巨大的成本,这种成本有时候甚至是隐藏的🏭
在本地预置型软件的旧时代,交付产品意味着刻录和运输物理介质——无论是在服务器端还是在桌面运行,软件的成本均由买方承担。如今,在SaaS 占主导的情况下,这一成本已被推回给供应商。大多数软件公司每个月都要支付大笔的AWS或Azure账单——软件的要求越高,账单的数额就越大。
而事实证明,人工智能的要求相当高:
训练一个AI模型可能要花费数十万美元(或更多)的计算资源。尽管将其视为一次性成本很诱人,但重新训练已被视为一项不断持续的成本,因为提供给AI模型的数据会随着时间而变化(这种现象称为“数据漂移”,data drift)。
与运行传统软件相比,模型推断(在建模过程中生成预测的过程)在计算上也更加复杂。同时,跟从数据库中读取数据相比,执行一连串的矩阵乘法也需要更多的数学运算。
与传统软件相比,人工智能应用更有可能对图像、音频或视频等富媒体进行处理。这些类型的数据消耗的资源比一般的数据更耗存储资源,处理成本高,并且经常会遇到感兴趣区域的问题——可能需要应用来处理大文件才能找到相关的小片段。
有AI公司告诉我们,跟传统方法相比,云计算操作可能更复杂,成本更高,尤其是因为没有好的工具可以在全球范围内扩充AI模型。其结果是,一些AI公司必须定期跨云去转移训练好的模型——这一出一入要消耗大量成本才能改善可靠性、延迟和满足合规性。
这些东西加到一起往往要占到AI公司在云资源上面的花销的25%或更多。在极端情况下,处理特别复杂任务的初创企业会发现人工处理数据反而要比跑训练过的模型便宜。
采用专用AI处理器可以提供部分帮助,这些AI处理器可以更有效地执行计算,而优化技术(例如模型压缩和交叉编译)可以减少所需的计算量。
但是我们还不清楚这条效率曲线的形状。在许多问题领域上,处理和数据需要指数性增长才能取得精度的渐进性改善。就像我们之前指出过那样,这意味着模型复杂性的增长速度惊人,而处理器想要跟上已经不大可能。光有摩尔定律已经不够。(举个例子,自2012年以来,训练最先进的AI模型所需的计算资源增长了300000倍,而NVIDIA GPU的晶体管数量仅增长了约4倍!)分布式计算是解决此问题的一个比较吸引人的办法,但这主要是解决处理速度的问题,解决不了成本问题。
毛利率,第2部分:很多AI应用都要靠“人在回路”(humans in the loop)才能保持较高的精度👷
人在回路系统有两种形式,均会导致许多AI初创企业的毛利率下降。
首先:训练当今大多数最先进的AI模型都涉及到人工清理和标记大型数据集。这个过程耗力又耗钱,术语AI得到更广泛采用的最大障碍之一。另外,如上所述,一旦部署了模型,训练就不会结束。为了保持准确性,需要不断去捕捉和标记新的训练数据,并将其反馈到系统里面。尽管诸如漂移检测和主动学习之类的技术可以减轻负担,但经验数据显示,许多公司在此过程中的支出(通常还没把核心工程资源计入)最高可占到收入的10-15%,同时持续的开发工作并不仅仅只是典型的错误修复和特征添加。
其次:对于许多任务而言,尤其是那些需要更多认知推理的任务而言,往往要把人实时嵌入到AI系统里面。比方说,社交媒体公司雇用了成千上万的人工审核员来增强其基于AI的审核系统。许多自动驾驶汽车系统都有远程操作员,大多数基于AI的医疗设备都要跟作为联合决策者的医生进行交互。随着越来越多的现代AI系统的能力得到理解,越来越多的初创企业正在采取这种做法。计划出售纯软件产品的许多AI公司正在慢慢把服务能力引入内部,并预定相关成本。
随着AI模型性能的提高,对人工干预的需求可能会下降。但是,把人从这个回路里面完全剔除不太可能。无人驾驶汽车等许多问题太过复杂,复杂到无法通过当前的AI技术实现完全的自动化。安全、公平以及信任等问题也需要人的监督——美国、欧盟和其他地区当前正在制定的AI法规里面可能会体现这一事实。
随着AI模型性能的提高,对人工干预的需求可能会下降。但是,把人从这个回路里面完全剔除不太可能。
即便我们最终实现了某些任务的完全自动化,也还不清楚这样就可以提高多少的利润。AI应用的基本功能是处理输入数据流并生成相关的预测。因此,操作这样的系统的成本是所处理的数据量的函数。一些数据点要由人工处理(相对昂贵),而其他的数据点则可由AI模型自动处理(希望能更便宜)。但是每一个输入都需要进行处理,只是处理的方式不同。
那么,到目前为止,我们已经讨论了两类成本,也就是云计算和人工支持。减少一类成本往往会导致另一类成本的增加。公式的这两个要素都可以优化,但没有一个有可能达到SaaS 业务那种接近零成本的水平。
AI系统的扩充困难也许会高于预期,因为AI处在长尾那头🐍
对于AI公司而言,知道什么时候找到了产品市场匹配要比传统软件困难得多。很容易会认为你已经找到了——尤其是在拿下了5到10个大客户之后——但接着你会看到自己的ML团队开始膨胀,而客户部署计划开始恶心地一拖再拖,挤占了发展新客户的资源。
在许多情况下,罪魁祸首都是边界情况(edge case)。许多AI应用都有着开放式的界面,并且可以处理有噪声的非结构化数据(比方说图像或自然语言)。用户往往对产品缺乏直觉,或更糟糕的是,假定产品具有人类或超人的能力。这意味着边界情况无处不在:我们研究过的AI产品预期功能多达40-50%都处在用户意图的长尾之中。
换句话说,用户可以,并且也会输入几乎所有的给AI应用。
换句话说,用户可以,并且也会输入几乎所有的给AI应用。
处理这个巨大的状态空间往往是一件繁琐的事情。由于可能的输入值范围太大了,以至于每次新的客户部署都可能生成从未见过的数据。哪怕是看似类似的客户(比方说,两家汽车制造商都要进行缺陷检测),就因为简单如在装配线上安装视频摄像头这样的事情,也可能需要大不相同的训练数据。
一位创始人把这种现象称为AI产品的“时间成本”。她的公司每拿到一个新客户的时候都要专门用一段时间来进行数据收集和模型微调。这让他们能够去看看客户数据的分布情况,同时在部署前排除掉一些极端情况。但这也会带来成本:公司的团队和财务资源都被捆绑到一起,除非模型的准确率达到了可接受的水平才能脱手。训练期的持续时间一般都是很难确定的,因为更快地产生训练数据的可选手段基本上没有……不管团队再怎么努力都不行。
到头来人工智能初创企业一般都要花费比预期更多的时间和资源来部署自家的产品。要想提前识别这些需求是很困难的,因为传统的原型设计工具(比方说模型、原型或Beta测试)往往只能照顾到最常见的路径,不能涵盖边缘情况。跟传统软件一样,部署到最早的客户群的时候,这个过程特别耗时间,但是跟传统软件不同的是,这一过程未必会随着时间的流逝而消失。
捍卫AI业务的指导手册仍在编写当中⚔️
伟大的软件公司都会挖掘一条又宽又深的护城河。最好的护城河力量非常强大,比方说网络效应、切换成本高以及规模经济等。
AI公司也可能具备所有这些因素。不过防御的基础通常是靠技术优越的产品造就的,尤其是企业型的。成为实现某种复杂软件的第一人可以带来重大的品牌优势和一段几乎算是独霸市场的时期。
在AI的世界里,技术的差异化是很难实现的。新的模型架构主要是在开放的、学术性的环境下开发出来的。任何人都可以从开源库里面找到参考实现(预训练的模型),并且模型参数还可以自动优化。数据是AI系统的核心,但这通常归客户所有,或者放在公共领域,或者随着时间的流逝而成为商品。随着市场的成熟,其价值也会逐渐下降,并且网络效应也相对较弱。在某些情况下,我们甚至发现跟数据馈送AI业务相关的规模不经济的情况。随着模型变得越来越成熟(可参见《数据护城河的空洞承诺》一文https://a16z.com/2019/05/09/data-network-effects-moats/),每一个新的边缘案例的解决成本都会变得越来越高,同时能够获得其价值的客户数量也会越来越少。
这并不一定就意味着AI产品的防御性就要比纯软件产品低。但是,对于人工智能公司而言,这条护城河似乎比许多人预期的都要浅。从防御性的角度来看,人工智能在很大程度上可能是通往底层产品和数据的通道。
这并不一定就意味着AI产品的防御性就要比纯软件产品低。但是,对于人工智能公司而言,这条护城河似乎比许多人预期的都要浅。
建立,扩充和捍卫伟大的AI公司——给创始人的实用建议
我们认为,人工智能公司要取得长期成功,关键是要应对挑战,并充分利用服务和软件的优势。秉承这种精神,创始人可以采取以下一些步骤来促进新的或现有的AI应用的蓬勃发展。
尽可能消除模型的复杂性。我们已经看到,不同客户要训练不同的模型的初创企业跟所有客户都能够共享同一个模型初创企业之间在COGS(销货成本)方面存在着巨大的差异。“单一模型”策略更易于维护,可更快地推向新客户,并支持更简单、更高效的工程组织。这往往还能减少数据管道的蔓延以及重复的训练,从而可以显著改善云基础设施的成本。虽然没有达到理想状态的灵丹妙药,但关键之一是要在达成协议前尽可能多地了解你的客户及其数据。有时候,很显然,新客户会给你的ML工程工作带来巨大负担。在大多数情况下,变更会比较微小,仅涉及少数几个独特的模型或只需进行一些微调。做出这些判断(权衡长期经济健康与短期的业务增长)是AI创始人面临的最重要的工作之一。
要仔细(通常是严格)地选择问题域,以降低数据的复杂性。从根本上来说,想让人工劳动自动化是很困难的一件事。许多公司发现AI模型的最小可行任务的范围比他们预期的要狭窄。比方说,有些团队在为电子邮件或者职位发布提供短建议中已经取得了成功,但提供一般的文字建议就困难得多。仅仅是更新记录这一条,专攻CRM领域的公司已经为AI找到非常有价值的利基市场。类似这样的一大类问题都属于对人比较困难,而AI相对容易的类型。这些问题往往牵涉到大规模、低复杂度的任务,比方说审核、数据输入/编码、转录等。专注于这些领域可以最大程度地减少总会遇到边缘情况的挑战,换句话说,这可以简化为AI开发馈送数据的过程。
我们认为,人工智能公司要取得长期成功,关键是要应对挑战,并充分利用服务和软件的优势。
为高度可变成本做好计划。作为创始人,你应该为自己的商业模型提供可靠、直观的思维框架。本文所讨论的成本是有可能改善的——可减少一定幅度——但假设这种成本会完全消失(或强迫其消失)是错误的。相反,我们建议在考虑毛利率较低的情况下去建立商业模式和GTM(市场推广)战略。来自创始人的一些好的建议:要深刻理解提供给模型的数据的分布情况。要把模型维护和人的失效当作首要问题。要跟踪和衡量自己的实际可变成本——不要把它们藏在研发费用里面。财务模型要做出保守的单元经济假设,尤其是在融资期间。不要等到规模扩大或外部技术进步了才去解决问题。
拥抱服务。AI有巨大的机会来满足它所在的市场。这可能意味着要提供全栈翻译服务而不是翻译软件,或者提供出租车服务而不是卖自动驾驶汽车。建立混合型业务比开发纯粹软件更难,但是这种做法可以提供对客户需求的深刻洞察,并且产生出发展迅速,引领市场的公司。做服务也可以成为企业启动进入市场引擎的绝佳工具,尤其是在销售复杂和/或全新的技术时。关键是要坚定地追求一种策略,不要想同时支持软件客户和服务客户。
对技术栈的变更要未雨绸缪。现代的AI仍处在起步阶段。可帮助从业人员用高效和标准化的方式完成工作的工具还正在搭建中。在接下来的几年当中,我们希望看到可以让模型训练自动化、可以提高推理效率可以对开发人员的工作流标准化以及监视和保护生产环境的AI模型的工具得到广泛使用。一般来说,云计算作为软件公司要解决的成本问题也越来越受到关注。如果应用跟当前的工作方式是紧耦合的话,可能会在将来导致自己做体系结构方面处于劣势。
用老派的办法来强化防御力。虽然还不清楚AI模型本身或基础数据是否能提供长期的保护,但好的产品和专有数据几乎总能做出好的生意。人工智能为创始人提供了解决旧问题的新视角。比方说,就凭借着表现出更好的性能,人工智能技术在相对冷清的恶意软件检测市场里面已经产生出新的价值。在最初的独特产品功能之上构建出带粘性的产品和可持久业务的机会永远都存在。有趣的是,我们还发现有几家AI公司通过有效的云战略巩固了自己的市场地位,这有点类似于最新一代的开源公司。
总结一下:
从传统意义上讲,当今大部分的AI系统都完全属于软件。其结果是,人工智能业务看起来并不完全像软件业务。这门生意牵涉到不断的人力支持以及显著的可变成本。其可扩性一般没有我们希望的那么简单可以实现。而(对于“开发一次卖多次”的软件模式至关重要的)强大的防御能力似乎不是免费就能取得的。
这些特征令AI在某种程度上感觉像服务业。换句话说,服务公司你可以换,但不能(完全)取代服务。
信不信由你,但这可能也是个好消息。类似可变成本、扩充性以及防御性的护城河之类的东西最终都是要靠市场而不是单个公司决定的。我们在数据里面看到不熟悉的模式这一事实表明,AI公司确实是新事物——这意味着进入新市场并创造大量机会。已经有许多伟大的AI公司成功地在迷宫般的想法里面穿行,并开发出性能始终如一的产品。
信不信由你,但这可能也是个好消息。类似可变成本、扩充性以及防御性的护城河之类的东西最终都是要靠市场而不是单个公司决定的。我们在数据里面看到不熟悉的模式这一事实表明,AI公司确实是新事物
人工智能仍处在从研究主题到生产技术过渡的早期阶段。大家很容易就会忘记,无疑是推动一波AI软件开发浪潮的先驱的AlexNet,诞生仅有8年。智能应用正在推动软件行业向前发展,它的下一步会如何发展呢?我们对此感到兴奋。
原文:a16z.com上
原标题:The New Business of AI (and How It’s Different From Traditional Software)
译者:boxi