今天是2025年的元宵节,随笔把开年的思考做一个记录。
2025年春节期间deepseek火了,今天从自己的思考角度分享一些观点,其中有遥不可及文化大佬的观点引用,也有身边行业大咖们的碎片分享,就不一一做出处说明。
人的知识结构:知识、方法、智慧。知识属于社会,智慧属于个人。知识可以授受,方法靠示范,智慧靠启迪。比如计算机硬盘里,我们有非常多的文档,它是知识,必须加上程序是方法,结合起来才有智慧。
--易中天
推理能力
计算机技术一直在提升人类处理信息的效率,而今天大模型时代是提供了人类处理信息的“推理能力”,把计算机向智慧体进化。
我所理解的计算机处理信息的阶段,划分为:信息阶段、认知阶段、推理阶段。
我们以:滴滴想开车去北京。这一个需求背景,来设想。
计算机的单机时代、互联网时代、移动互联网时代都是处于:信息处理阶段。只是这三个时代演进中,计算设备的形态变革,信息处理本质上没有大的超越。今天的时间节点来看信息阶段很好理解了;在认知阶段,做为程序的开发者,必须自己去设计和理解“我想开车去北京”的背后需求,然后再写一段代码去实现导航信息、天气信息的获取,整合后提供给用户使用。认知=认识+知道。一段文字、一张图片、一段视频、一段语音等(下文统称为:信息载体),认知阶段就完成:认识信息载体是什么类型,知道信息载体包含的信息。
文字推理能力
大模型诞生以前,通过nlp技术,计算机可以理解“文本”背后的逻辑和语意关系了,比如:滴滴想开车去北京。在信息处理阶段,计算机只能单纯的知道这7个文字,文字仅仅是文字,不是一句话,更不知道这句话表达的含义;如果您是滴滴同学,你自己还得使用导航软件看下路况和最佳路径,然后再通过天气app查询下未来12小时内天气情况。注意,这三件事情,都得滴滴同学一个步骤一个步骤的去完成,然后他自己去判断:现在出发是否可行,到达北京的时间点和天气自己是否可以不冻感冒。
大模型出来后,计算机来到了推理阶段。大模型可以通过“滴滴想开车去北京”推理出来进一步信息:开车去北京就需要知道:基于当前时间点,未来10小时内的路况和导航信息、天气信息,这两个信息具备了,可以提升:滴滴想开车去北京的成功率和顺畅度。同时,还可以根据路况和天气情况给滴滴同学建议出发的时间点和导航最优路况。后面这一步,在今天通过大模型就非常简单的实现了,并且是全自动在一个地方完成,不需要切换多个app。
图片推理能力
大模型诞生以前,通过openCV技术,计算机可以理解“图片”包含的信息,但是,仅仅是知道了图片包含的信息,就没有然后了。然后的事情,还得靠程序员继续规划和设计业务逻辑,才可以完成一些相对复杂的业务需求。
先看以下两张图片:
在信息阶段,计算机完成:图片的生成、存储、处理、分享等。在认知阶段,计算机完成:图片识别。图1识别结果是:两个杯子和一部移动电话。图片2识别结果(假设是使用的yolo做对象人识别)是:11个人,1个足球,N个观众。然后,就没有然后了,后端程序接收到识别结果后,基于业务需求再去写具体的业务需求。
比如图1输出:杯子1+黑色,杯子2+白色,移动电话+黑色,程序再结合识别结果去干后续任务:计数、颜色区分、材质区分等。比如图2输出:人11+(黄色、黑色、白色、红色),足球1+白色,程序再结合识别结果去干后续任务:人数统计、基于颜色的球队区分、进攻防守区分等。注意,前面两个示例的“后续任务”都是需要程序员代码实现(此处忽略产品经理等流程)。
如果基于当前图片识别结果,再能推理判断下这个图片背后的更多信息和逻辑关系,再进一步行动和决策就更具科学性。这是人类期待的计算达到的高度。以前的技术在后半截的处理是有技术障碍的,今天的大模型出来后,补充了这部分的技术障碍。
到了大模型时代,接入DS后,大模型基于“图1+图2”的输入,自动理解图片,然后我们附件需要实现的提示词,计算机就会完成以前需要多个程序块才能完成的复制任务。
比如图1,把图1输入大模型;同时,再输入一个提示词:告诉我上述图片中包含了什么?分别分析出他们的材质和颜色。同时,再分析一下这个图片会有什么潜在风险?
图2,把图2输入大模型;同时,再输入一个提示词:以目前图片的情况,结合附件excel提供的两支球队最近1年的战绩数据,帮我预测本场球赛的比分。(本场比赛的当前比分、比赛时长等信息都位于图片左上角,大模型自己识别)
ps:尝试过几个视觉模型,效果都没达到笔者预期的效果,所以就不分享示例截图了。但这只是一个时间问题。
好了,前面通过2个简单的示例来说明大模型在:感知和推理方面带来的巨大变革。一是记录自己最近的思考笔记,二来通过通俗易懂的语言解释大模型,供能看到我朋友圈的每一位好朋友们,快速高效理解AI原理。说小点,不至于在贩卖焦虑的大环境下焦虑,拨开迷雾看本质。说大点,更多的好朋友们理解了大模型,如何优化自己的工作效率,优化自己的产品等等。最后分享身边大咖们的观点结束此文(我得准备过节去),更多信息和思考后面再行补充吧。
有个说法,用于评价是AI+还是+AI
1,去掉AI,产品就挂了,就是AI+
2,去掉AI,产品变傻了,就是+AI
结论:AI+是杂交生命,+AI是平替续命。
--某大咖
符号不一定是信息,信息不一定是数据,数据不一定是知识,知识绝对不等于智慧。
在AI平权时代,大家都可以利用好AI工具,好干工作,干好工作。
刘子润于长安
2025-02-12