elmo 实验心得及elmo个人理解

1. 名词:ELMO:哈工大LTP 开发的动态词向量。

问题一:何为动态词向量: 普通的词向量,是静态的,也就是一个词代表一个N维向量,这种向量不随着语境的变化而变化,不管在任何语境下embedding的值都是不变的; elmo词向量,是基于深度学习神经网络的词向量。是动态的。elmo的output随着语境的变化而变化,在不同的句子里面有不同的表现。比如:“我今天吃的苹果很好吃”;“苹果手机非常好用”。这两个句子里面的“苹果”,在elmo里面的embdding值一定是不同的。这也更符合语义层面的NLP项目。

2.ELMO实现:

一.原版实现

  EMBBEDDING LAYER (词向量层) )->(cnn/lstm)

  ENCODEING LAYER(编码层)-> (lstm/elmo)

(1)ltp提供的中文版词向量的embedding层是这样的(cnn): 


 (2) encoding层是这样的(elmo): 


(3)ltp提供的词向量的embdding层是cnn的,若是一个双层的LSTM加一个linear,若是encoding层相同

二.轻量级基于feed评论的训练及实现

  EMBBEDDING LAYER(词向量层) ->(emb)

  ENCODING LAYER (编码层) ->(lstm 单层) 

轻量级的 elmo,就是一个简单的embedding映射,再加一个单层的lstm,只是loss的设计思路借鉴elmo的ltp代码。 轻量级考量原因:1. 网络结构简单好上线; 2. 显存限制(使用轻量级的结构,在序列长度限制在100以内的情况下,已经是7-8G,足够将一个显卡打满了)3. 大道至简。(个人认为elmo的设计亮点在loss,而前面的网络结构简单或复杂,不会带来效果根本性的差异。

3. ELMO的输出维及loss计算原理:

(1)结论1: elmo的输出维就是词典的大小,与Word2vec的设计相似。

(2)结论2: elmo的设计思路就是从前面的词预测后面的词,loss也就是前面序列的output与后面序列output的softmax值做crossentropy(交叉熵)

从这个图中可以将loss的原理简单阐述清楚:

该图画的是一个batch的output计算loss的原理图。看源码也可以:

4.遇到的问题:显存泄露 (out of memory)

解决: 该网络中,影响显存的因素有 seqlen(序列长度), batch_size, input_dim(输入维),hidden_dim (隐藏层),字典大小(输出维),简单计算一下memory与这些因子之前的关系:

embedding layer : mem_embedding = seqlen * batch_size * input_dim

lstm layer: mem_lstm = seqlen * input_dim * hidden_dim *4

connect layer and loss :mem_connact = hidden_dim * output_dim * seqlen

综上可以得出 memory = mem_embedding + mem_lstm+ mem_connact = seqlen(batch_size * input_dim + 4input_dim * hidden_dim + hidden_dim *output), 显存与seqlen序列长度是倍数影响关系,其他影响按重要性排序分别是input dim,output dim,hidden dim,也就是要减小显存,首先要保证seqlen不要太大。

经过笔者的实验,seqlen序列长度设置为500会有明显的out of memory, 控制在100,显存8G左右,也满足目前的工程需求。

5. 实验的效果

elmo训练方式                              | 召回  |  准确 | auc

input 长度:128; loss计算方式:前20与后20    |36.40%  |  85% |  0.977

input 长度:50,loss计算方式:前后去掉一个词的全序列 |36.7% | 85% |0.987

非elmo预训练                              |34.4% |85% |0.973

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容