行为体的未来:人工智能将彻底改变你使用电脑的方式并颠覆软件行业
作者:比尔•盖茨
今天,我仍然像保罗•艾伦和我创办微软公司时一样热爱软件。尽管几十年来软件已经有了很大的进步,但是在很多方面软件仍然很笨。
要在电脑上完成任何任务,你必须告诉设备该使用哪个应用程序。你可以用微软 Word 和谷歌 Docs 来起草一份商业提案,但它们无法帮你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。即使是最好的网站,也不完全理解你的工作、个人生活、兴趣和人际关系,利用这些信息为你做事的能力也很有限。现在这种事情只有在另一个人身上才能做到,比如亲密朋友或个人助理。
这种情况在未来五年将彻底改变。你无需针对不同的任务使用不同的应用程序。你只需用日常用语告诉设备你想做什么。根据你选择与它分享的信息量的多少,软件将能够做出个性化的回应,因为它将对你的生活具有丰富的了解。在不久的将来,任何上网的人都能拥有一个由远超当今技术的人工智能所驱动的个人助理。
这种类型的软件被称为行为体(agent),它能对自然语言做出响应,并能根据它的用户知识完成许多不同任务。我思考行为体问题已经接近30年,并在 1995 年的《未来之路》一书中对行为体进行论述,但是直到最近由于人工智能的进步行为体才变得切实可行。
行为体不仅将改变每个人与计算机的交互方式,而且将颠覆软件产业,带来从输入命令到点击图标以来在计算领域的最大变革。
人皆可用的个人助理
一些评论者指出,软件公司以前也推出过这种产品但用户并不完全接受。(人们至今还在拿Clippy开玩笑,它是微软Office中的一个数字助理,后被放弃)。为什么人们会使用行为体呢?
答案是它们将有戏剧性的改善。你将能与它们进行细致的对话。它们将更加个性化,而且不会局限于写信这样相对简单的任务。Clippy 与行为体的相同之处就像旋转电话与移动设备的相同之处那么多。
只要你愿意,行为体就能帮助你完成所有活动。只要你允许行为体跟踪你在网上的互动和现实世界中的位置,它就会对你相关的人员、地点和活动有深刻的了解。它会了解你的个人和工作关系、爱好、偏好和日程安排。你可以选择它如何和何时介入,以帮助你解决某些问题或要求你做决定。
“Clippy是一个自动程序(bot),而不是一个行为体。”
为了理解行为体将带来的戏剧性的变化,让我们将行为体与当今可用的人工智能工具进行比较。这些工具大多是自动程序。它们仅限于一个应用程序,一般是在你写下一个特定单词或寻求帮助时才会介入。因为它们不会记住你是如何一次又一次使用它们的,所以它们不会变得更好,也不会学到你的任何偏好。Clippy是一个自动程序,而不是一个行为体。
行为体更聪明。它们积极主动——在你向它提出要求之前就能给出建议。它们跨越应用程序完成任务。随着时间的推移,它们会不断改进,因为它们会记住你的活动,并在你的行为中识别你的意图和模式。根据这些信息,它们会提供它们认为你所需要的,尽管总是由你作出最终决定。
假设你想规划一次行程。旅行自动程序会找出符合你预算的酒店。行为体将知道你在一年中的什么时间去旅行,根据它对你的了解——是总是尝试新的目的地还是喜欢再次回到同一个地方——向你推荐地点。当你提问时,它会根据你的兴趣和冒险倾向推荐要做的事情,并会在你喜欢的餐厅类型预订。如果你现在想要这种深度个性化的规划,你需要付钱给旅行社(travel agent),花时间告诉他们你想要什么。
人工智能行为体最令人兴奋的影响是他们将使当今对大多数人来说过于昂贵的服务民主化的方式。它们将在四个领域产生特别大的影响:医疗保健,教育,生产力,娱乐和购物。
医疗保健
如今,人工智能在医疗保健领域的主要作用是帮助完成管理任务。例如,Abridge、Nuance DAX 和Nabla Copilot可以捕捉预约过程中的音频,然后写成笔记供医生审阅。
真正的转变是在行为体可以帮助病人进行基本的分诊,获得如何处理健康问题的建议,并决定是否需要寻求治疗的时候。这些行为体还将帮助医护人员做决定,提高工作效率。(目前,Glass Health等应用程序已经可以分析病人摘要,并提出诊断建议供医生参考)。对贫穷国家的人们而言对病人和医护人员的帮助尤其有益,因为那里许多人根本没有机会看医生。
这些临床医生行为体的推广速度会比其他行为体慢一些,因为把事情做好是生死攸关的问题。人们需要看到证据,证明医疗行为体总体上是有益的,即使他们并不完美,也会犯错。当然,人类也会犯错,无法获得医疗服务也是一个问题。
“需要心理健康护理的美军退伍军人中有一半得不到护理。”
心理保健是行为体将为实质上所有人提供服务的另一个例子。如今,每周一次的心理治疗似乎是一种奢侈。但是,还有很多需求没有得到满足,很多可以从治疗中受益的人却没有机会接受治疗。例如,兰德公司发现,需要心理健康护理的美军退伍军人中有一半得不到护理。
在心理健康方面训练有素的人工智能行为体将使治疗更加经济实惠、更容易获得。Wysa和Youper是其中两个早期的聊天机器人(chatbot)。但是,行为体将更加深入。如果你选择与心理健康行为体分享足够多的信息,它就会了解你的生活史和人际关系。它会在你需要的时候出现,而且永远不会不耐烦。经你同意,它甚至还能通过智能手表监测你对治疗的身体反应,比如当你和老板谈论问题时,你的心跳会开始加速,并建议你何时应该去看人类治疗专家。
教育
几十年来,我一直对软件能让教师工作更轻松、帮助学生学习的各种方式感到兴奋。它不会取代教师,但会补充教师的工作——为学生提供个性化的服务,将教师从文书工作和其他任务中解放出来,让他们有更多的时间从事最重要的工作。这些变化终于开始以戏剧性的方式发生。
这项技术的当前状态是Khanmigo,一个由可汗学院(Khan Academy)创建的基于文本的机器人。它可以辅导学生学习数学、科学和人文学科——例如,它可以解释二次方程式,并创建数学问题进行练习。它还可以帮助教师编写教案等。我长期是萨尔•可汗(Sal Khan)的粉丝和支持者,最近我还请他在我的播客(podcast)中谈论了教育和人工智能。
但是,基于文本的机器人只是第一波——行为体将带来更多的学习机会。
例如,很少有家庭能花钱请一位导师一对一辅导学生来补充他们的课堂作业。如果行为体能抓住家教有效的关键点,他们就能为每一个有需要的人提供这种补充教学。如果辅导行为体知道一个孩子喜欢 Minecraft 和 Taylor Swift,就会利用 Minecraft 来教他们计算图形的体积和面积,利用 Taylor 的歌词来教他们讲故事和押韵。这种体验将比今天的基于文本的导师更加丰富(例如图形和声音),并且更加个性化。
生产力
这一领域的竞争已经非常激烈。微软正在将其Copilot作为 Word、Excel、Outlook 和其他服务的一部分。谷歌也在做类似的事情,将Assistant with Bard 及其生产力工具结合起来。这些副手(copilot)可以做很多事情,比如将书面文档转化为幻灯片,用自然语言回答有关电子表格的问题,在表达每个人观点的同时总结电子邮件主题。
行为体将做得更多。有了行为体就等于有了一个专门帮你完成各种任务的人,如果你愿意行为体还可以独立完成这些任务。如果你有商业想法,行为体会帮你写一份商业计划,为它创建演示文稿,甚至生成你的产品可能是什么样子的图像。公司可以让行为体为员工提供直接咨询,并参加每次会议以便回答问题。
“如果你的朋友刚做完手术,你的行为体会主动送花并能为你订购。”
无论你是否在办公室工作,你的行为体都能像今天的个人助理为高管提供支持那样为你提供帮助。如果你的朋友刚做完手术,你的行为体会主动送花并能为你订购。如果你告诉它你想和以前的大学室友叙叙旧,它就会和他们的行为体一起寻找聚会的时间,就在你到达之前,它还会提醒你,他们最大的孩子刚刚在当地大学上大学。
娱乐和购物
人工智能已经可以帮你挑选新电视,推荐电影、书籍、演出和播客。同样(Likewise),我投资的一家公司最近推出Pix,它可以让你提出问题(“我喜欢罗伯特·雷德福的哪些电影,在哪里可以看?”),然后根据你过去喜欢的内容进行推荐。Spotify 有一个人工智能驱动的 DJ(AI-powered DJ),它不仅能根据你的喜好播放歌曲,还能与你对话,甚至能叫出你的名字。
行为体将不是简单地提出建议,而是会帮助你采取行动。如果你想买一台相机,你可以让行为体为你阅读所有的评论,做总结,提建议,并在你做决定后下单购买。如果你告诉行为体想看《星球大战》,它就会知道你是否订阅了正确的流媒体服务,如果不是,它就会主动为你注册。如果你不知道自己想做什么,它会提出定制的建议,然后想办法播放你选择的电影或节目。
你还可以获得适合你兴趣的新闻和娱乐。CurioAI可以为你询问的任何主题创建一个自定义播客,这是对未来的一瞥。
科技行业的冲击波
简而言之,行为体实际上将能在生活的任何活动和任何领域提供帮助。它对软件业务和社会的影响将是深远的。
在计算机行业,我们谈论平台——应用程序和服务所依托的技术。Android、iOS 和 Windows 都是平台。行为体将是下一个平台。
“要创建一个新的应用程序或服务,你只需告诉行为体你想要什么。”
要创建新的应用程序或服务,你不需要知道如何编写代码或进行图形设计。你只需告诉行为体你想要什么。行为体将能够编写代码、设计应用程序的外观和感觉(look and feel)、创建徽标,并将应用程序发布到在线商店。OpenAI 本周发行(launch)的 GPTs 让我们看到,未来非开发人员也能轻松创建和分享他们自己的助理。
行为体将影响我们如何使用软件以及如何编写软件。行为体将取代搜索网站,因为它们将更好地为你找到信息并加以总结。行为体将取代许多电子商务网站,因为它们将为你找到最优惠的价格,而且不会局限于少数几个供应商。行为体将取代文字处理器、电子表格和其他生产力应用程序。如今各自独立的业务——搜索广告、带广告的社交网络、购物、生产力软件——将成为一个业务。
我不认为将会有任何单一的公司主导行为体业务——会有许多不同的人工智能引擎可供使用。如今,行为体被嵌入文字处理器和电子表格等其他软件中,但最终它们将独立运行。虽然有些行为体可以免费使用(并有广告支持),但我认为大部分行为体还是要付费的,这意味着公司将有动力让行为体为你的利益而不是为广告商的利益工作。如果从今年开始研究人工智能的公司数量来看,竞争将异常激烈,这将使行为体变得非常便宜。
但是,在我所描述的复杂的行为体成为现实之前,我们需要面对一些关于技术和如何使用技术的一系列问题。我以前写过关于人工智能所引发的问题(issues that AI raises)【译注:https://www.gatesnotes.com/The-risks-of-AI-are-real-but-manageable】,所以在这里我将特别关注行为体问题。
技术挑战
目前还没有人知道行为体的数据结构是什么样的。要创建个人行为体,我们需要一种新型数据库,它能捕捉到你所有细微的兴趣和关系,并能快速调用这些信息,同时维护你的隐私。我们已经看到了新的信息存储方式,如向量数据库,它可能更适合存储由机器学习模型生成的数据。
另一个悬而未决的问题是,人们将与多少个行为体互动。你的个人行为体将与你的治疗师行为体和你的数学辅导员分开吗?如果是这样,什么时候你希望它们相互合作,什么时候它们应该各司其职?
“如果你的行为体需要与你联系,它会与你通话或出现在你的手机上。”
你将如何与你的行为体互动?公司在探索各种方案,包括应用程序、眼镜、吊坠、别针、甚至全息图。所有这些都是可能的,但我认为人类-行为体(human-agent)交互的第一个重大突破将是耳塞。如果你的行为体需要与你联系,它就会对你说话或出现在你的手机上。(“你的航班延误了,你是想等一等,还是需要我帮忙重新订票?”)如果你愿意,它还能监测传入你耳中的声音,并通过屏蔽背景噪音、放大听不清的语音、或让口音重的人更容易听懂等方式来增强声音。
也还有其他挑战。目前还没有一个标准协议可以让行为体之间互相交流。需要降低成本,让每个人都能负担得起行为体的费用。需要以一种更容易让行为体给出正确答案的方式来提示行为体。我们需要避免出现幻觉(hallucinations),尤其是在像健康这样的一些领域,对准确性要求极高。我们也不希望行为体有能力去做他们不该做的事情。(虽然我不太担心流氓行为体,但我更担心人类罪犯利用行为体达到恶意目的。)
隐私和其他重大问题
随着这一切的发生,网络隐私和安全问题将变得比现在更加紧迫。你希望能够决定行为体可以访问哪些信息,这样你就可以确信你的数据只与你所选择的人和公司共享。
但是,与你的行为体共享的数据归谁所有,如何确保数据得到合理使用?没有人希望自己收到的广告与自己告诉治疗师行为体的事情有关。执法部门能否将你的行为体作为不利于你的证据?你的行为体何时会拒绝做可能对你或他人有害的事情?谁来选择内置于行为体中的价值观?
还有一个问题是你的行为体应该分享多少信息。假设你想见一个朋友:如果你的行为体与他们的行为体交谈,你不希望它说:“哦,她周二要去见其他朋友,不想让你参加。”如果你的行为体帮你写工作邮件,它需要知道不应该使用你的个人信息或先前工作的专有数据。
其中许多问题已经成为科技行业和立法者的首要考虑。最近,我与其他技术领袖一起参加了由参议员查克•舒默(Chuck Schumer)组织的人工智能论坛,许多美国参议员也出席了该论坛。我们就这些问题和其他问题交流了看法,并谈到立法者需要通过强有力的立法。
但其它问题不会由公司和政府决定。例如,行为体可能会影响我们与朋友和家人的互动方式。今天,你可以通过记住某人的生活细节(例如生日)来表达你对某人的关心。但是,当他们知道你的行为体可能会提醒你这个细节并负责送花时,这对他们来说还有意义吗?
在遥远的未来,行为体甚至可能迫使人类面对有关目的的深刻问题。试想一下,如果行为体变得如此优秀,以至于每个人都能拥有高品质的生活,而无需付出太多的劳动。在这样的未来,人们会如何打发时间?当行为体掌握了所有答案时,还会有人愿意接受教育吗?当大多数人都有大把空闲时间时,你还能拥有一个安全繁荣的社会吗?
但我们离这个目标还很远。与此同时,行为体正在到来。在未来几年里,它们将彻底改变我们的生活方式,无论是在线的还是离线的。
(译者:寿步)