NLP小项目--emojify(二)

模型构建

预训练词向量导入

上一篇博文里,我们已经完成了数据集的制作,接下来的一个问题就是,模型的构建,第一个问题就是词向量的问题,
我们已经有了一个训练好的词向量,那么在keras中很好处理,可以看我的gitghub keras 实现,那么pytorch是怎么实现与训练向量的导入的呢,如果看官方文档,查看完整参数列表,发现似乎没有参数可以实现预训练向量的导入,只有定义好就是随机的初始化向量。查看了源码,发现了存储embeding权重的变量就是weights,然后我
尝试直接修改weights的值,踩了几个坑,最后采用如下实现:

        self.word_embeds = nn.Embedding(vocab_size, embedding_dim)
        weight = np.array(weight)
        self.word_embeds.weight.data.copy_(torch.from_numpy(weight))

ok,测试一下,怎么测试呢,随便找个词输入可以查看50维度的词向量,输入到上面的embeding层中,再输入到一个
没有赋值的embeding层中,通过查看词向量是否一致来看是不行的,因为embeding层每次都会随机选取初始化向量的,
不一致才是正常的,因此我们可以通过执行两次上面赋值后embeding,看看是否一样,一样说明赋值成功了,否则的话
随机变化肯定是不会一样的。测试代码如下:

vocab_len = len(word_to_index) + 1  #word index begin with 1,plus 1 for padding 0
emb_dim = word_to_vec_map["cucumber"].shape[0]
emb_matrix = np.zeros((vocab_len, emb_dim))
for word, index in word_to_index.items():
    emb_matrix[index, :] = word_to_vec_map[word]

word_embeds = nn.Embedding(vocab_len, 50)
pretrained_weight = np.array(emb_matrix)
word_embeds.weight.data.copy_(torch.from_numpy(pretrained_weight))

input = Variable(torch.LongTensor([word_to_index["cucumber"]]))

print("111:",word_embeds(input))
print("222:",word_embeds(input))
print("333:",word_embeds(input))

为了保险,我输入了三次,结果都是一样的,这就说明赋值是成功的。

固定词向量

我们知道,训练时,我们是不希望词向量的值改变的,因为这个向量已经在很大的语料库上训练好了,不需要改变,因此就涉及到固定子层参数不更新的技巧。这个方法有很多,常用的是requires_grad和volatile,requires_grad = False等同于volatile = True。我就只说说前者了,每个Variable都有这个参数,自然就包括model的parameter,因此我们可以设置embeding层的参数的parameter的requires_grad为False,这样就不会计算他们的梯度了,这样还会提升模型训练的速度,因为预训练的词向量矩阵还是维度很大的,如果每次反向传播都计算它的梯度会极大地影响训练的速度。当然这样还是不够的,设置优化器的时候,第一个参数就不可以是model。parameter(),因为embeding层的梯度是没有的,也就优化不了,因此要将它排除。由于这里的层很少,因此我采用如下方法:

optimizer1 = torch.optim.Adam(model.rnn.parameters(),lr=0.001)
optimizer2 = torch.optim.Adam(model.linear.parameters(),lr=0.001)

就是用两个优化器,分别优化剩下的两个层。这个方法是我自己想的,不知道有没有什么bug。那么自然,后面更新的step,也要两个优化器一起step。完整代码我会上传到我的github的。

模型搭建

剩下的就蛮简单的了,注意好好看官方文档对应的API,每个参数都了解,能节省代码就节省代码,比如2层LSTM中间接dropout,keras是依次实现的,而pytorch可以直接一个函数实现。具体结构如下:

emojifier-v2.png

其他

  • 记得还有一个问题是,读取自定义数据集时,会把数据变成DoubleTensor,target变成了intTensor,转化成longTensor就是直接在后面加上.long(),就行了,其他的Tensor之间的转化也如此,.int(),.float(),等等。

  • 完整代码地址 pyTorch emojify,喜欢的别忘了点个star哦=-=

    我以后应该会出一个深度框架解读系列,目的就是让大家积极读源代码,这样才能彻底掌握这个框架,也督促我自己好好研读源码,因此大家Github上一定要关注这些框架的官方源码,时时关注更新动态,首先应该就是从pytorch和torchvision开始讲起,一个类一个类的详解,当然很多类也需要关联起来解读。然后其他框架的话再说吧,我了解的框架也就那么几个=-=

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容