240 发简信
IP属地:上海
  • seq2seq发展介绍

    因为seq2seq相关介绍博客很多,之前只是通过博客学习,一直没有读过相关论文。虽然通过博客对seq2seq大体框架有所了解,但是对于实现细节和...

  • 语言模型训练技巧学习

    (TRAINING A LANGUAGE MODEL ON A SINGLE GPU IN ONE DAY)[https://arxiv.org...

  • Resize,w 360,h 240
    Toolformer学习

    Toolformer[https://arxiv.org/pdf/2302.04761.pdf]是meta ai在23年2月发表的论文,主要提出...