crf-7 链实现准备(翻译)

源文地址:https://createmomo.github.io/2017/12/06/CRF-Layer-on-the-Top-of-BiLSTM-7/

3 链实现

在本节中,将解释代码结构。此外,还将给出实现CRF损失层的一个重要技巧。最后,Chainer(2.0版)实现源代码将在下一篇文章中发布。

3.1 整体结构

如您所见,代码主要包括三个部分:初始化、损失计算 和 对句子的预测标签。(完整的代码将在下一篇文章中发布)

image-20200522210903413.png

3.2添加两个额外的标签(START 和 END)

如2.2所述,在转移分数矩阵中,我们添加了START 和 END 两个标签。当我们计算某个句子的损失时,这将影响转移分数矩阵的初始化和发射分数矩阵的值.

[example]

假设在我们的数据集中,我们只有一种类型的命名实体PERSON,因此我们实际上有三个标签(不包括START 和 END 两个标签):B-PERSON、I-PERSON和O。

转移分数矩阵

在添加了两个额外的标签(START 和END)之后,当我们在init方法中初始化转移分数时,我们可以这样做:

image-20200522211115646.png

“value”的形状是(n_label + 2, n_label + 2)。 2是START 和 END的数量。另外,“value”的值是随机生成的。

发射分数矩阵

你应该知道,2.1中描述,BiLSTM层的输出是对一个句子的发射分数。例如,我们的句子有3个单词,BiLSTM的输出应该是这样的:

Word\Label B-Person I-Person O
w0 0.1 0.2 0.65
w1 0.33 0.18 0.99
w2 0.87 0.66 0.53

添加额外的 START 和END 标签后,发射分数矩阵是:

Word\Label B-Person I-Person O START END
start -1000 -1000 -1000 0 -1000
w0 0.1 0.2 0.65 -1000 -1000
w1 0.33 0.18 0.99 -1000 -1000
w2 0.87 0.66 0.53 -1000 -1000
end -1000 -1000 -1000 -1000 0

如上表所示,我们通过添加两个单词(start和end)及其对应的标签(start和end)扩展了发射分数矩阵。BiLSTM层的输出不包括新增词的发射分数,但是我们可以手动指定这些分数(如:xstart,START = 0 和 xstart,theOtherLabels=−1000)。单词“start”上的其他标签的发射分数应该是一个小的值(例如-1000)。如果你想再设置一个小的值,这是完全可以的,不会影响我们模型的性能。

3.3 更新的总体结构

基于上面的解释,这里有一份更详细的伪代码:

image-20200522211414780.png

下一篇

下一篇文章将是最后一篇。在下一节中,将发布使用Chainer 2.0实现的CRF层,并给出详细的注释。更重要的是,它也将在GitHub上发布。

参考文献

[1] Lample, G., Ballesteros, M., Subramanian, S., Kawakami, K. and Dyer, C., 2016. Neural architectures for named entity recognition. arXiv preprint arXiv:1603.01360. https://arxiv.org/abs/1603.01360

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,837评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,551评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,417评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,448评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,524评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,554评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,569评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,316评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,766评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,077评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,240评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,912评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,560评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,176评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,425评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,114评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,114评论 2 352