大模型面试题：Prefix LM和Causal LM的区别是啥？

获取更多面试真题的集合，请移步至 https://i.afbcs.cn/naPbNY

说白了：就是attention mask不一样，如下所示：

image.png

它们定义如下：

Prefix LM（前缀语言模型）：在输入序列的开头添加一个可学习的任务相关的前缀，然后使用这个前缀和输入序列一起生成输出。这种方法可以引导模型生成适应特定任务的输出。

Causal LM（因果语言模型）：也称为自回归语言模型，它根据之前生成的 token 预测下一个 token。在生成文本时，模型只能根据已经生成的部分生成后续部分，不能访问未来的信息。

最后编辑于：2024.11.02 08:56:13

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

LLM面面观之Prefix LM vs Causal LM
1. 背景关于Prefix LM和Causal LM的区别，本qiang在网上逛了一翻，发现多数客官只给出了结论...
mengrennwpu阅读 820评论 0赞 0
UL2：统一语言学习范式
UL2: Unifying Language Learning Paradigms https://arxiv.o...
Valar_Morghulis阅读 584评论 0赞 0
Google T5 预训练模型
近年来，在大规模预训练语言模型上，各大公司的军备竞赛卷得十分激烈！前面我们介绍过GPT系列的三兄弟GPT-1,GP...
乘瓠散人阅读 13,907评论 0赞 3
Anthropic的大语言模型
Anthropic推出Claude语言大模型https://www.anthropic.com/index/int...
Valar_Morghulis阅读 908评论 0赞 0
恒源云(GPUSHARE)_未闻Prompt名(论文学习笔记)
文章来源 | 恒源云社区原文地址 |未闻Prompt名[https://gpushare.com/forum/t...
恒源云阅读 760评论 0赞 3

赞1赞

赞赏

手机看全文