240 发简信
IP属地:上海
  • seq2seq发展介绍

    因为seq2seq相关介绍博客很多,之前只是通过博客学习,一直没有读过相关论文。虽然通过博客对seq2seq大体框架有所了解,但是对于实现细节和发展并不是很清楚。近日在学习c...

  • 语言模型训练技巧学习

    (TRAINING A LANGUAGE MODEL ON A SINGLE GPU IN ONE DAY)[https://arxiv.org/pdf/2212.14034...

  • 120
    Toolformer学习

    Toolformer[https://arxiv.org/pdf/2302.04761.pdf]是meta ai在23年2月发表的论文,主要提出了一种新方法,可以教导大语言模...