基于博文 Advanced RAG Techniques: an Illustrated Overview 的学习和练习的记录。
中文内容可以查看博主@宝玉的译文 高级 RAG 技术:图解概览 [译]
系列笔记:
RAG 学习笔记(一)
RAG 学习笔记(二)
RAG 学习笔记(三)
RAG 学习笔记(四)
RAG 学习笔记(五)
RAG 学习笔记(六)
RAG 学习笔记(七)
RAG 学习笔记(八)
RAG 学习笔记(九)
相关技术练习:rag-practice
写笔记的原因
RAG 系列笔记终于完成,写笔记的主要原因是博文 Advanced RAG Techniques: an Illustrated Overview 非常不做,类似于一篇综述,梳理的 RAG pipeline 中重要的技术,而且有很多引用资源。另外一个原因就是看完一遍感觉似懂非懂,想要将其中的一些内容实现,就打算写一下笔记,梳理一下。
能坚持下也是想不到了,从笔记发布时间可以看到,第三篇和第四篇之间有一周多的间隔,是因为对写系列笔记这一行动有所怀疑与动摇,一来觉得这样知识转化速度慢,二来没有正向反馈,不知道是否值得。不过,在动摇期间,看了一篇博文 Publishing your work increases your luck,主要表达了:你需要将你所做的事情分享出去,不要陷于完美主义和担心负面评价;重要的是分享你做事的热情,别人会被你的坚持所感染。于是下定决心,完成笔记,希望能对读者带来些许帮助。
感受
去年年初 OpenAI 的 ChatGPT 出圈引爆大模型行业,各种技术出现,大量相关的信息也一起涌入。技术的快速迭代和信息爆炸,让我感到很焦虑,在去年 3月份写了一篇博文“处于AI时代的焦虑”进行了记录。
现在回头看,其实也非常感谢自己坚持完成这个系列。在写笔记的过程中,梳理了知识点,有了比较清晰的技术框架,在期间又进行了实践练习,对相关技术心理有底,缓解了这段时间的焦虑。
根据这一年的心路历程,发现解决焦虑的方法就是:
- 信息过滤:千万别让过多的信息压垮你,看看收藏夹里面成千上万的内容,哪些你看过?筛选几个信息源,选择几个信息源用来了解整个技术发展方向,粗略浏览即可。另外精选 1-2 个源,作为学习内容的来源,内容要少而精,要去细看内容。
- 构建知识框架,不断完善:一定要构建知识的框架、体系,不要被网络、社交媒体上的杂乱知识占据,形成感觉啥都懂,但又啥都不懂的状态。有了框架和体系,就能了解自己知道什么、不知道什么了,可以根据需要安排学习计划,不断填补空白。
- 周期复盘,整理总结:记录并分享学习的过程和内容,积累自己的知识库、内容库。定时整理总结,内容积累到一定量,就可以发现内容之间可以相互链接,要么形成知识架构,要么相互引用丰富内容。
其实还有一个就是“快速处理信息的能力”,快速从信息中获取知识、快速学习的方法是很重要的,不过目前我个人还是没有摸索出来,尝试使用大模型,但是对生成的内容质量没有信息,所以还是忍不住自己看一遍。
不过,学习本来就是要花时间的,焦虑是没用的,安心下来真正做一些工作,成体系且能够坚持下去。如果希望饭香,就要把时间煮到饭里面。