登录注册写文章

5. LLMs中常用的预训练任务包含哪些？

5. LLMs中常用的预训练任务包含哪些？

在进行模型的大规模预训练时，往往需要设计合适的自监督预训练任务，使得模型能够从海量无标注数据中学习到广泛的语义知识和世界只是。

目前，常用的预训练任务主要分为三类，包括语言建模(Language Modeling,LM)、去噪自编码(Denoising Autoencoding, DAE)以及混合去噪器(Mixture-of-Denisers,MoD)。
下图展示了语言建模和去噪自编码各自的输入与输出示例。

语言建模和去噪自编码的输入输出对比

5.1 语言建模（Language Modeling，LM）

语言建模任务是目前绝大部分大语言模型广泛采用的预训练任务。该任务的核心在于“预测下一个词元”，并且经常被应用于训练基于解码器的大语言模型，例如GPT。

本质上看，基于语言建模的预训练还可以看作是一种多任务学习过程。
基于大模型文本预料的预训练任务能够潜在地学习到解决终生任务的相关知识和任务。
训练效率：Prefix Decoder < Causal Decoder
- Causal Decoder结构会在所有token上计算损失，而Prefix Decoder只会在输出上计算损失

5.2 去噪自编码（Deniising Autoencoding，DAE）

去噪自编码任务是另外一种常见的语言模型预训练任务，广泛应用于BERT、T5等预训练语言模型中。
在去噪自编码任务重，输入文本经过一系列随机替换或删除操作，形成损坏的文本。模型的目标是根据这些损坏的文本恢复出被替换或删除的词元片段。
与语言建模星币，去噪自编码任务的视线更为复杂，需要设定额外的优化策略，如次元替换策略。

5.3 混合去噪器（Mixture-of-Denoisers，MoD）

混合去噪器，通过将语言建模和去噪自编码的目标均视为不同类型的去噪任务，对于预训练任务进行统一建模。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

综述：自然语言处理的预训练模型
翻译自Xipeng Qiu*,School of Computer Science, Fudan Universi...
京漂的小程序媛儿阅读 11,751评论 1赞 5
知识增强的预训练语言模型系列之ERNIE：如何为预训练语言模型注入知识
©NLP论文解读 |杨健论文标题： ERNIE:Enhanced Language Representation...
NLP论文解读阅读 3,966评论 0赞 0

自然语言预训练模型大总结
先来一张图。本文主要援引复旦大学邱锡鹏教授的论文：NLP预训练模型综述，对预训练模型进行了一些梳理模型参数的数量...
凌冰_lonny阅读 11,499评论 0赞 3
ELECTRA：作为鉴别器而非生成器的预训练文本编码器
ELECTRA: Pre-training Text Encoders as Discriminators Rat...
Valar_Morghulis阅读 3,477评论 0赞 0
XLNET预训练模型
XLNET分别做了三件事情来刷新高度，分别是：PLM创新、引入Transformer-XL思路、更大数据规模。 P...
松下问童子zwy阅读 6,450评论 0赞 0

1赞2赞

赞赏

手机看全文