0
3
5611
因为seq2seq相关介绍博客很多,之前只是通过博客学习,一直没有读过相关论文。虽然通过博客对seq2seq大体框架有所了解,但是对于实现细节和...
(TRAINING A LANGUAGE MODEL ON A SINGLE GPU IN ONE DAY)[https://arxiv.org...
Toolformer[https://arxiv.org/pdf/2302.04761.pdf]是meta ai在23年2月发表的论文,主要提出...