大模型应用-概念

prompt：提示词工程
从用户角度来说，我认为提示词不是很重要，只要自己的表述清晰就可以了
但是从工程角度来说，理解学习挺重要的，需要改写用户提示词更好的喂给模型

这，那，他，她等需要从语意上下文改成明确的人
用户语言命中关键字又模糊的时候要提示ABC选项，问清意图
一个对话八个问题，需要拆解好问题
few-shot，给一部分样例，2-5个比较好不要太多，用于参考缩小模型理解范围
cot，推理链条，将问题拆解为步骤，1-2-3步得出结论

RAG
现在很多小公司都会使用，可以用coze等成熟的搭建，也可以自己写。范围非常宽，不是很多人概念中的不需要更改模型，rag的也可以结合微调，就是在微调过程中加入知识库训练，这可以大大提高准确率。不过从成本而言rag还是尽量不动模型。

知识库，从各种文档来，最好的格式当然是md，别的格式还要处理归档
chunk，用段落标点拆分，简单的可以用字符数量，和重叠字数等。但是这个分的过程中一个关键就是会粗暴拆分语意，所以简单的重叠是这么做的。但是我问了公司里面一个项目，他们是用字符比如500个直接拆，没有重叠部分，然后用一个小一点的模型判断，上下文关联是不是要拼接，chunk算是结束但是后续阶段会用graph关系判断关系，比如搜曹操会搜出相关的人和事，尽量给出答案。
Embedding，比较有名world2vec，向量数据库大概就是拆成各种向量，算相似度余弦夹角，点乘/各自平方和开根。

向量怎么提取呢，一种方法提取字和单词，过滤掉没有意义的他/的/是这些，然后用算法发现一部分词太多没有区分度影响判断也过滤；这种情况下字改变位置余弦结果，所以要用2个/3个相邻字也提取向量做判断。
还有判断方法也就是关键字，发现有哪些关键字，像推广搜
当然还有别的纬度，就是越多纬度的话，可能结果比较准确

检索排序重拍打分：向量太多了，这时候就要粗略筛选，从很多向量数据库里吗，从不同维度考虑分别取topK；从这些里面再排序判断打分，生成答案和参考的文档。

function call：
大部门模型的api都支持这个，自己准备很多函数给模型，然后问模型问题的时候，模型自己会判断要不要调用函数，相关接口返回告诉你调用什么，调用外部函数api像今天天气后，再调一次模型api生成答案
MCP: model context protocol
通用的协议，可以代替FC，可以说是一个外部的FC广场智能管理，更公开，增强AI功能和实时性，服务者可以提供服务挣钱，比如说高德地图

未完...

总的来说各种工程的应用是不难的，无非是组合各种方法，在某些阶段插入合适的大大小小的模型介入判断和生产，比如说专门用模型生成prompt啊，专门去拆去提取，难的是提高准确率，是迁移能力，还有根本的判断标准

最后编辑于：2026.01.06 15:23:28

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

大模型应用-概念

大模型应用-概念

相关阅读更多精彩内容

友情链接更多精彩内容