先锋教师培训活动的内容异常丰富,甚至可以说是我迄今为止参加过的最佳培训。因此,我感到有必要抓紧记录下这段时间的感悟和感受,以免几天后记忆模糊,浪费了这次宝贵的学习机会。
第一个先讲讲7月16日第一天的学习内容。培训的首日上午,我们有幸聆听了刘老师关于“人工智能时代AI智能体的生成与应用”的探究学习讲座。
事实上,我去年就曾设计生成过一个AI智能体,我做的是一个名为“小学科学教育大师”的智能体。我向它输入2022年科学课程标准的全部文本数据并进行测试。然而,遗憾的是,当时的智能体还不能有效地从数据库中检索答案。它常常会给我提供2017年科学课程标准的内容。例如,当我询问2022年科学课程标准中提到的核心素养是什么时,它往往回答的是旧课程标准中的知识与能力、方法态度、责任、价值观等,而不是最新的核心素养。
因此,我那时对智能体的实用性并不抱有太大期望,甚至觉得“就这?”。我有了解过吴恩达教授关于Agent(智能体)的讲座,我也了解过这样的一个说法——五个基于ChatGPT3.5的Agent进行写作可能比一个ChatGPT4效果更好。
这意味着,如果能合理地设置和安排Agent,它们往往能够发挥出更出色的、更意想不到的效果。
原因是什么呢?原因在于,现在的很多AI大模型并不知道你会问出什么样的问题,他并不知道向他提问的是什么领域的人,想要提出什么领域的问题,因此它们需要有一个非常庞大的数据库作为储备。这样,无论遇到任何领域的问题,它们都能给出相应的回答。正因为如此,它们需要巨大的计算能力,并且还要在如此庞大的数据库中匹配到合适的内容。我们这里讨论的,涉及大模型语言处理的算法。由于我自己对这方面的了解并不深入,所以就不在这里过多解释了。
但是,当我们试图制造或者说生成一个智能体时,我们通常都会有一个非常明确的,具有针对性的目标。所以其实对于那些与目标无关的内容,智能体其实可以不需要管那些数据,也不需要去查询那些数据,那它就可以变得“小而美”或者说“简而美”。比如,如果我只想做一个文案标题的大师,那么其他关于汽车的结构是啥、污水怎么处理、自行车链子掉了怎么办之类的数据,就完全不需要它去关注。这个模型只需要专注于文案标题创作就可以了。
再比如,我想做的是一个小学科学教育的智能体,我的目的很明确,那就是为小学科学老师服务。那么这个模型就应该只关注小学科学的内容。可能我之前在做这个模型的时候,全网关于2022年版课程标准的数据并不够多。我们都知道,大模型的数据更新是有一定延迟的,而且它也可能没有把“调用我输入的数据库”这件事的优先级排在很前面,所以它的表现可能不够理想。
但这一次,借着学习如何构建智能体的机会,我再次使用了我之前的模型,而且此前我还没有对它进行调试。然而,我惊喜地发现,当我再次问它2022年科学课标中提出的新核心素养是什么时,它居然能够优先调用我给它输入过的知识库来给出回答,所以这一次的回答非常准确。
因此,我认为在这个时候,我重新回去研究智能体的生成和应用是非常有必要的。
回到这次的培训过程,刘老师和任老师的课程依然保持着一贯的风格,将实践和理论相结合。所以这一次,我们先花了一点时间复习了之前在深圳培训时所学的内容。开始实践后,在任老师的介绍下,我们了解了智能体是什么,以及常见的可以创建智能体的平台,比如“COZE”“豆包”“智谱清言”等。当然,还有很多公司都想要尝试进入这个领域(做To C的智能体),实际上,市面上的大模型非常多,对于我们个人用户来说,很难比较出它们之间具体的优劣。我认为,只要一个模型能够满足你的预期,那它就足够了。所以,选择一个自己喜欢的、合适的大模型就可以了。
“豆包”和“COZE”都是字节的模型。我并不是特别清楚为什么要大费周章地分别建立两个做智能体的平台,难道他们之间的用户不是重叠的?(不过这是产品经理要考虑的事情,和我们用户就无关了)。
我创建过“豆包”的智能体,也创建过“COZE”的。我感觉“豆包”的智能体建立起来会比较简单,因为“豆包”只需要用户提出idea——想要创建哪一个垂直细分领域的智能体,“豆包”预置好的程序会帮你自动设计并完成后续的内容。简而言之相当于你只要提出一个想法,“豆包”平台会帮你把这个想法建立出一个智能体。但是因为最重要的内容AI已经帮你完成了,所以你在生成这个智能体中的贡献,基本上就只剩下“提出idea”这件事。因此,有时你可能会感觉“豆包”的智能体生成出来的结果并不是特别符合你的理想。比如说,我想做一个“小学科学教育大师”,我是想让它特别会“小学科学教育”(也就是给科学老师做教育学辅导的),但是豆包平台给做出来的可能会理解成,这个大师是要给小学生做科学教育的(也就是给小学生做科学知识辅导的)。虽然如此,在回复逻辑和人物设定上,还是挺披着“智能体”的皮的。
至于“COZE”,它涉及更多复杂的操作,给了用户更多操作的权限。这是一把双刃剑,既然给你更多的自由度和灵活性,你可以操作的上限就变高了,也可以更加个性化地设置,但与此同时,你需要设置、考虑和调试的内容也会变多。甚至当你想要建立工作流时,你可能还需要具备一定的编程知识。不过虽然我不会写代码,但我还是可以使用“COZE”建立基本的智能体。当然,COZE平台也做了很多贴心的设计。比如,在你设置人物设定和回复逻辑时,它会用AI语言帮你优化——这也是我们一直说的“要用AI来调教AI”。我非常喜欢COZE平台的一点,是它可以让我选择不同的语言模型(如有“豆包”模型,还有像“kimi”(moonshot)的语言模型,以及“智谱清言”(GLM)的一些模型。不过我并没有比较过这些模型的优劣……目前还是随便选)。选完这些模型后,还有一点我比较中意的,就是你可以选择给它们输入什么样的数据。
为什么输入针对性的数据库还有必要呢?举个例子大家就明白了,我们老师在用市面上一些通用语言模型的时候,会发现,当让它们写教学设计时,它们有时写教学目标还是会从三维目标出发,而不会从核心素养出发。很多老师经常有一种感觉就是:AI生成的东西,外行看来很有模有样,内行看起来却破绽百出。所以,我在建立这个智能体(小学科学教育大师)时,就是想让它能够结合现有课程标准中的数据,去辅助教师做一些相应的工作,工作成果还得是内行看起来“不太差”的。 虽然如前所述,它已经能够去调用数据库里的东西来回答了,准确率提高了不少。但依然离我理想中的状态还是有点差距。
我的理想状态是什么呢?说出来不怕大家笑话。比如说,当我给定一节课的课题时,它能够从我输入给它的数据库中先调取相关的文本——比如说教学设计或者是教材的文本,然后分析文本内容,找到与课标中的哪些部分相匹配。比如,识别出学科的核心概念、跨学科概念,以及相应的学业质量目标和学段目标等等。并且,它应该能够根据刚才读取的这些课标文本,帮我设计出对应的本课的教学目标和教学流程等。这样,才能算是真正根据课标精神进行教学设计,更有针对性也更靠谱,而不是内行看来破绽百出的东西。当然,AI完成的这个教学设计肯定还不会是最终完成的、我交出去的设计,毕竟它还没有到可以替代人的头脑和想法的时候,但这样肯定可以提供一些很有针对性的、有参考价值的设计文本,大大提高教师备课的效率。
以上就是我的设想,可能看起来比较复杂,但绝不是没有可能实现。对于这个想法,我也跟任老师进行了交流。我们一致认为,目前的AI可能还没有办法完全理解并实现我这样的需求。以下是几个接近的解决思路:
第一个解决方法,是多次对话,在不断地对话中调整它的思路和回答。然后通过合理的提示词(也就是目前非常火热的“提示工程”里的学问,以后有机会再说)。通过明确的任务框定和有技巧的提问方法,让AI更有针对性地给出回答。
第二个方法,就是我现在想要研究的,就是使用工作流(workflow)来帮助输出。比如说,我告诉AI,第一步先去调取教材的文本;第二步,把调取的教材文本与数据库中的课标知识进行匹配;第三步,把匹配后的结果再整理成相应的文档;第四步,把这个文档里的要求输入进去,根据这个文档生成教学目标等。这样一套工作流程下来,就相当于我帮它细分了任务流程,也就是我们现在流行说的SOP(Standard Operating Procedure,标准操作程序)。按照这样的标准化流程操作下来,输出的结果就更能接近用户的预期。而设计并设置这样一套标准化流程,其实就很像我们以前用的“宏”或者“按键精灵”,把一些需要重复操作的流程直接内置,我们不需要每次都重复提问这些问题。只需要给它一个Input,然后它自己内部去走一遍这个流程下来,坐在电脑前的我们只需要获得它给的Output就好了。如果能做到这样该多好呀!
以上就是我对AI智能体未来想要研究的方向和这次培训的思考。
这次培训还有一个点给我留下了深刻印象,那就是——团队的力量是巨大的。
刘老师和任老师为我们设计了一个特别好的活动,除了让我们练习生成自己想要的智能体,还要把这个智能体分享给大家使用。我们每个人关注的点都不一样,虽然每个人只设计了一个智能体,但有了分享之后,一节课下来,每个人都可以拥有几十个非常有意思的、充满创意的智能体。比如说,我这次看到,有的老师设计了减肥食谱的智能体,有的老师设计了日语口语教练的智能体,还有的老师设计了关于运动方面的智能体。纵览一遍,最大的感受就是:脑洞有多大,这个世界就有多大。所以我认为,这次的智能体培训非常具有实操价值,也具有前瞻性和前沿性。工欲善其事,必先利其器,把趁手的AI工具用好,才能让我们的教育教学工作事半功倍。