关于AI的一点想法

前言

自2022年AI爆火之后,我以体验者的身份,一路见证其发展并深度参与其中,不知不觉间已成了AI的重度用户。从最初的通过Web Chat与AI进行交互,到现在通过图形化界面、CLI工具与AI交互,AI以不同的方式为我扮演着一名合格的协作者的角色,可以说,AI工具不仅改变了我的工作方式,还极大地提高了我的工作效率。

最近几个月,我的工作重心聚焦于针对特定业务场景的算法调优,而AI在这一过程中发挥了举足轻重的作用,让我愈发觉得自己已经离不开这些AI工具了;不过,使用AI的过程也并非一帆风顺,我确实踩过不少“坑”。

在AI发展的不同阶段我对AI有着不一样的感受和认识,这些感受里有悲观、有乐观、有认可,也有对自己职业生涯的深切怀疑,但无论是哪种感受都是清晰且深刻的,我经常在等待AI给出答案时思绪万千。早在创建公众号之前,我就萌生了写一篇AI相关文章的想法,这个念头在我脑海里酝酿已久,今天,我打算付诸实践了。

与其他文章有所不同,我并不打算在开头就展开对AI相关内容的讨论,而是打算换个角度,先从使用AI的人入手。

通过观察身边的人,我发现,若从对AI的接受程度和使用程度来划分,大致可以将人群分为四类:

第一类是“充耳不闻型”。这类人要么从未使用过AI,要么短暂体验后因未达预期便拒绝继续使用。无论AI如何发展或提升,他们都始终选择忽略。

第二类是“浅尝辄止型”。这类人更多是以一种尝试的心态去体验AI,或仅将其视为快捷的搜索工具。他们有可能进一步发展,成为“初窥门径型”用户;也有可能退步,变成“充耳不闻型”。形成这种差异的关键在于,他们是否能清晰、明确地向AI表达自己的意图和要求。

第三类是“初窥门径型”。这类人具备使用AI的基本技巧和意愿,能够清晰、明确地表达自己的需求,但对AI的认识还相对基础,尚无法利用AI完成较为复杂的任务。

第四类是“得心应手型”。这类人对AI有深刻的认识,了解其能力边界,能够最大限度地发挥AI的潜力,并规避其不足,从而深度利用AI解决工作和生活中的问题。

就我周围的人而言,总体来看,“浅尝辄止型”和“初窥门径型”的用户居多。

AI有哪些特点?

在进入对AI的具体讨论前我们有必要了解下现有的AI是如何实现的。
现阶段的AI底层技术的核心是LLM(大语言模型),LLM本质是概率预测器,其工作原理是:输入被切成 Token,它根据已有序列预测下一个 Token 的概率分布,这基于训练时海量数据学到的规律和模式;生成内容时,它不断算概率分布、选 Token、更新序列。要提高生成准确性,需给它更多有效信息,而“有效”的标准较为复杂

现阶段AI的特点及局限:

概率&不可靠性

LLM的实现本质就决定了AI是按照概率生成内容的,这种概率本身就会带来不可靠性,它不可能百分百准确,这不是工程问题,是数学问题。只要基于概率,就必然有误差。拿同一个问题多次询问AI,我们不能期待获取完全一样的答案,我们可以用“感冒了应该怎么办?”测试AI,每一次得到的答案并不完全相同。
我们可以将AI看做是一本包含世间所有已知知识的百科全书,这本书实在太厚以至于就算仅按照目录索引也无法完全枚举,甚至是对同一个知识点的阐述都无法完全枚举,因此我们每次提问都能得到一个答案。


AI投掷筛子.png

记忆力&注意力

LLM的记忆力与注意力机制是开发者们模拟人类大脑进行的设计,用来突破传统模型的局限,提升语言处理能力,实现更智能、灵活的人机交互,专注于提升记忆力和注意力的上下文工程已经成为AI工程领域的核心范式。但是现阶段的记忆力与注意力机制让然存在很多问题,主要表现为:

  • 受上下文窗口限制,“记忆力”有限
  • 在长会话中无法准确理解当前对话内容的意图


    马什么梅.jpg

例如,有这样的一个对话内容:

我非常喜欢孙悟空,他勇敢、无所畏惧的形象给我留下了深刻印象。
...
最近流感季节得流感的人很多,我也得了流感。
...
我也非常喜欢孙悟空
...

这是一个跳跃性的对话内容,里面涉及到了孙悟空和流感,如果是与人对话,在每个阶段都能准确识别当前对话的意图,这是因为人能够分析、推理和联想。但如果是与AI完成上述对话,AI可能会在你谈论孙悟空时回复流感相关内容,在你谈了流感时又回复孙悟空相关内容,还有可能会给出孙悟空得流感这种让人啼笑皆非的答案。

这不是一个真实的案例,我只是想通过这个案例来说明AI本身的局限性,AI大模型这种本质的局限性就要求我们不能指望它在处理长会话、复杂性任务时仍能够表现良好。

可知&不可知

人类学习知识大都遵循由简单到复杂、由浅入深的规律,比如我们是先学会加减乘除,再学二元一次方程组,再学微积分,对复杂知识的掌握是建立在对简单知识掌握的基础上的,也就是说,人类的知识体系是层次性、累进性的,基于这个前提,我们可以说不可能有一个人擅长解决微积分相关问题但是对加减乘除和二元一次方程却一窍不通,只可能出现因为粗心大意导致的错误;也就是说人的可知和不可知是有迹可循的,我们能够明确在什么场景下人可能会犯什么样的错误,所以我们得以引入各种规范、流程和自动化降低人为的错误,这点在软件工程领域表现的尤为明显。

但是当我们以同样的视角看待AI时,我们过往的经验就不能直接复用了,理论上AI具备客观世界的所有知识,但这也只是人使用无数知识库训练后的结果,AI并不能真正理解什么是二元一次方程组、什么是微积分,更不可能理解两者之间的关系,于是我们能够惊奇的看到一个现象:AI为我们解决了十分复杂的微积分,但是简单的鸡兔同笼问题却犯了难。AI只是根据概率从无穷的知识库中选取一个答案,所以我们无法对于AI什么时候会犯错给出一个明确的预期,我们不知道AI什么时候能够给出正确答案,什么时候是在一本正经的胡说八道。

AI的这种不可知特性就决定了现阶段其只能作为一个辅助工具,人仍然在其中占据确定性的主导地位。我们不可能将飞机调度、地铁调度这种生命财产攸关的场景完全交给AI来决策,同样的,我们也不会允许将AI生成的代码不加审查、测试直接发布到生产环境。

这我真不知道.png

责任感、责任心

AI本身的概率性和不可知性决定了其是不可能具备责任感和责任心的,AI不关心什么是责任感、什么是责任心,AI也不会对结果负责。线上疯狂报错系统濒临崩溃时我们能指望AI来修复bug吗?项目群里客户疯狂吐槽甚至要骂娘的时候我们能指望AI来安抚客户情绪吗?我详细答案是显而易见的。那么人为什么会具有责任心和责任感呢?从主观上来说,有自动要求和自我驱动的因素,客观上来说,我们扮演的每个角色都会被其他人进行评价,这些评价会带来道德上和利益上的约束,是人不得不为结果进行负责。从这一点来说,我觉得人是不可能完全被AI替代的,因为人起码还能承担起背锅的角色,这个结论真让我有点哭笑不得,真不知道应该是高兴还是悲哀。

这个锅你必须背.png

创新性&创造性

借用专利领域中对于新颖性和创造性的评判标准,对AI的创新性和创造性定义如下:
创新性:不属于现有技术
创造性:与现有技术相比,该发明具有突出的实质性特点和显著的进步

也可以使用两个过程来描述,创造性是从0到1的过程,创新性是从1到1.1的过程。
我们可以看到,在数学领域和生物医药领域已经有成功使用AI的案例:陶哲轩使用AI解决数学问题、医药公司使用AI探索新的药物分子结构。这些勇敢的尝试确实是展现了AI的创新性,但是这种创新还停留在现有知识的破碎和重组,AI在突破算力的限制尝试一些不可枚举的组合为我们带来了不一样的知识。

但是AI能够带来创造性吗?AI在艺术领域的表现更适合回答这个问题,当我们不设置预期、不设置标准要求AI生成一幅画或者是一首音乐时,我们首先会惊叹AI如此之快的完成“创作”,而且这些画或者音乐乍一听乍一看居然还不错;但是当我们设置一些标准和要求时,我们又会发现AI的创作是如此的幼稚、平庸,有些甚至只是简单的拼接重组远远达不到我们的目的,我们更不能期待AI能够生成《星空》和《命运交响曲》这样蕴含丰富情感给人以心灵震撼的旷世奇作。
未来的AI会具有创造性吗?现在一眼望去仍然是一片迷雾。

什么情况下适合用AI

如果让我挑选两个关键词描述人与AI的关系,我会挑选“拥抱AI”和“协作”,这两个关键词本身就反映了AI在人类世界的参与趋势,从最初的“拥抱AI”到现在的“协作”,AI已经不可避免的改变了人们的生活和工作。得益于短视频和自媒体的蓬勃发展,无论你是否真正的使用过AI,相信你都刷到过“AI不会替代人,但会使用AI的人会替代不会使用AI的人”这类视频或文章,在这里我无意再次强调这个观点传播焦虑,我想和大家分析下我们工作的实质是什么。

就大多数人的工作内容而言(当然这里我们讨论的是需要使用电脑完成的工作,体力劳动型工作不在我们的讨论范围内),我认为工作的实质其实是重复,现有的计算机软件已经尝试使用可视化、流程化、自动化提高人工处理的效率,但是其并不能改变工作重复的本质,而且软件的开发、实现方式(对业务场景的枚举)也决定了其只能接受有限的输入解决有限的场景,从这一点说,从事工作中的每个人都天然具备了成为“初窥门径型”的可能性。

因此,学会使用AI的第一步就是发现自己工作中的重复部分,尝试将这些重复部分交给AI,然后再对AI处理结果进行审查,这样我们会有更多的时间提升自我和思考人生(摸鱼)。

搬砖使我快乐.png

如何使用好AI呢?

先学会和AI说话

与AI沟通的基本前提就是清晰的表达自己的意图、明确自己的要求,把AI想象成你的下属,只有意图和要求明确清晰的情况下你的下属才能完成工作且符合你的要求。
比如你有记录每日工作内容的习惯,每周周末时你需要将每日工作内容整理成周报并且想让它不那么难看没有条理,你想要使用AI来完成写周报的任务。

方式一:
根据日报内容给我写周报

方式二:
在这个对话中,你将扮演一个周报助手的角色,当用户给出提供一周内的工作内容时,你需要对周报内容进行润色、格式调整,满足以下要求:
1、如果原工作内容描述不清楚或者有歧义,你需要重新梳理表达并且不超出原始表达的意义
2、格式化工作内容格式,使其看起来更加清晰更有条理性
3、原工作内容如果冗长则需要你采用更简洁的方式表达出来
4、注意,你修改润色后的语句含义一定不要超出原始表达内容,务必要精准

显然,方案二会比方案一达到的更好的效果,因为其明确的表达了意愿和要求。对于其中重要的部分,你可以多次强调以提高生成结果符合预期的概率。

以准备背锅的心态接受AI的生成结果并审查

AI的实现原理就决定了其不可能是完全可靠的,AI也没有责任心和责任感不会对结果负责,这必须成为默认的使用规则,我们必须怀疑并仔细审核AI给出的每一个答案,依次来弥补AI可靠性、责任心、责任感的缺失。

将复杂任务拆解成多个简单任务

大多数工作内容的重复性是多个阶段、步骤的重复性,实际上每个阶段和步骤都适合拆分成一个独立的任务交由AI完成,假设一个复杂任务由三个子任务组成,每个子任务单独执行的成功率p=0.9,将复杂任务拆成成简单任务至少有三个好处:

  • 更容易检查错误,及时修复
    在每个子任务完成后即审查结果及时修复问题,问题仅作用在当前子任务内,影响面更小更利于处理

  • 整体的成功概率更高
    在一次对话中同时完成三个子任务且结果符合预期的概率是:
    成功率=0.9 * 0.9 * 0.9=0.729
    复杂任务中各部分常有逻辑依赖,因此错误相关性增强,导致实际成功率低于 0.729。
    分三次对话完成三个任务的步骤是:
    完成子任务1,成功率0.9,检查和纠正错误直至符合要求。
    完成子任务2,成功率0.9,检查和纠正错误直至符合要求。
    完成子任务2,成功率0.9,检查和纠正错误直至符合要求。
    每次都是全新推理,避免误差传播,用户可以在每次之间检验、调整输入。实际有效成功率远高于 0.729,常能达到 >0.9 甚至接近 1.0。

  • 更省钱
    如果是使用cursor、codex、claudecode等付费工具,将复杂任务拆解成简单任务能够避免消耗了大量token一顿输出结果却给出了错误答案,大量的token消耗就意味着money的消耗。

未来是什么样?

我无法描绘AI的未来是什么样,但是我相信的是AI一定会越来越强大,这是技术发展的规律。人的未来是什么样呢?我觉得人一定是要会使用AI的,以一种怀疑但是乐观的态度,对AI生成的结果怀疑,对AI生成的过程乐观。为什么一定要会使用AI呢,因为这一过程是不可逆的,一旦使用了AI去解决问题就能够意识到其巨大的价值,这种价值是我们不可能忽略的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容