240 发简信
IP属地:北京
  • 120
    transformer语言模型原理解读

    一、简介 基于假设:一个词在句子中的意思,与上下文(语境)有关。与哪些词有关呢?Transformer就是:利用点积将句子中所有词的影响当成权重都考虑了进去。 RNN序列化处...

  • Dataloader重要参数与内部机制

    @[TOC] 一、pytorch数据输入 Dataset负责生产数据,DataLoader负责数据的分批(batch_size)、采样(sampler)、传输Pytorch版...

  • google-research/bert官方代码中的坑_run_classifier_效果很差原因

    [[TOC好像还不支持]] 简介 bert官方代码google-research/bert中有很多很强的设定,稍有改动就会导致结果很差。此文档简单总结如下。google-re...

  • 不错,原版的英语才是硬道理!

    极致英语学习APP,这六款足矣

    英语学习的软件,那真是多如牛毛。有些做的很渣,但也有很多是做的极好的。如果你有选择困难症,那你真的应该好好看看这篇文章。如果没有,你最好也看一看,一定不会让你失望的。 1、最...