Named Entity Recognition & Transfer Learning

读论文分享

今天囫囵吞枣地看完了两篇文章:

1.Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism
2.Dynamic Transfer Learning for Named Entity Recognition

这两篇文章都是基于迁移学习的命名实体识别

迁移学习:对比源领域和目标领域之间的相似性,并且对这些相似性通过一些迁移学习方法进行利用

第一篇文章是基于对抗迁移学习的中文命名实体识别,命名实体识别的主要任务分为两个步骤:1.确定实体的边界 2.给分割好的实体标注类型。中文的命名实体识别不同于英文,它的第一步分词就很重要,直接决定了后面标注的结果。第一篇文章利用NER和CWS之间的相似性和不同点建立了一个新的模型,既捕捉了他们之间相似的边界信息,又避免各自独有的特征被学习到共享特征向量中去。论文还利用了self-attention层去捕捉句子之间的长距离依赖,以实现更好的标注效果。

模型

他的主要模型如下:


1.Embedding Layer

这一层主要就是利用预训练的词嵌入(eg:word2vec,Glove)层将NER和CWS中的词转化为词向量。

2.Shared-Private Feature Extractor

如上图所示,作者在第二层采用的主要模型就是BiLSTM,即双向LSTM,它通过引入门控机制和记忆cell来解决在RNN上的梯度爆炸和消失的问题,与之前的迁移学习不同,基于对抗的迁移学习将特征的抽取分为两类,一类是共享的边界特征的抽取,另一类是NER和CWS各自的特殊的特征的抽取。

3.Self-Attention

self-attention机制能够捕捉句子的内部结构信息,作者采用了multi-head attention机制,它与self-attention机制类似,主要是每次采用不同的权重矩阵与Q,K,V相乘,最后将结果相加。

4 Task-Specific CRF

CRF层主要是转移矩阵的训练

5 Task Discriminator

作者将对抗训练融入到迁移学习中去,就是为了不让CWS的特殊特征渗透到共享特征的表示中去,任务鉴别器的目标就是最后从共享的BiLSTM层训练得到的特征的向量表示无法被区分是来自NER还是CWS。还有个最小最大化函数,个人理解:最大程度的干扰task discriminator,让它尽可能地学习正确地鉴别句子的来源,然后最小化识别的错误(???)

6 Training

常规做法,定义损失函数,然后Adam算法更新参数

实验

1.数据集

2.实验结果

original WeiBo NER

updated Weibo NER

Signal NER
实验结果分析

作者提出的方法在原始的微博数据集上和Sighan数据集上的表现都有很大的提升,观察图2和图4发现F1值分别提升了4.67%和1.63%,但从图3上来看,总体的F1值略有下降,分析原因可能是:1.微博的数据集太小了,只有1.3k个句子,模型的没有充分训练 2.微博的数据是社交媒体数据,句子表达都很不规范

3.消融实验

image

5.case study

image

未完。。。。。。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,997评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,603评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,359评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,309评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,346评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,258评论 1 300
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,122评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,970评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,403评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,596评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,769评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,464评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,075评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,705评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,848评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,831评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,678评论 2 354