8a35d942139d - 简书

发简信

14
关注
1
粉丝
0
文章
0

字数
0

收获喜欢

IP属地：北京

NLP与人工智能

BERT 模型蒸馏 Distillation BERT
BERT 在很多 NLP 任务上都取得不错的效果，但是其模型体积与计算量都很大，而且现在出现了更多越来越大的模型，例如 roBERTa 和 GPT2。由于这些模型的太大，难以...

4243 0 3
行云一一

ALBert论文阅读笔记-缩减版的bert，模型参数更少，性能更好
引言自从Bert被提出来后，后续的研究者大多基于bert进行改造，提升预训练语言模型性能，从而提高下游任务的性能。比如ERINE、BERT_WWM、MASS、MT-DNN、...

1666 0 2
A君来了

Faiss核心技术（二）
在Faiss核心技术[https://www.jianshu.com/writer#/notebooks/28459409/notes/89930372]一文中我以Index...

1834 0 2
张虾米试错

Bert细节整理
本文是对bert的细节进行整理，分成3个部分的问题：目录输入与transformer相比输入有什么不同？ bert的3种embedding分别有什么意义，如果实现的？ ...

7984 3 3
张知道q

知识蒸馏-简单
参考文献： https://github.com/DA-southampton/NLP_ability/blob/master/%E6%B7%B1%E5%BA%A6%E5%A...

472 0 1

暂无个人介绍