emnlp论文阅读笔记 2021-04-12(未允禁转)

Language Generation with Multi-Hop Reasoning on Commonsense Knowledge Graph

1.研究背景

  • 预训练语言模型的知识低效且不系统。尽管语言模型通过在大量语料上预训练隐式地学习到了一定的知识,然而这种获取知识的方式没有显式利用知识库和知识图谱,较为低效

  • 融合外部知识增强模型推理能力的研究仅仅依靠独立的知识三元组。文章认为这样忽略了知识图谱中知识之间的丰富相关性,这些相关性可能为复杂的推理提供多个合理的证据

2.文章目的

基于常识知识图谱的推理,完成语言生成任务。关键词:知识图谱推理

3.文章贡献

提出基于常识知识图谱的多跳推理文本生成模型

GRF模型架构图
  1. use GCN to encode the static graph context to obtain graph-aware representations for the concepts and the relations (GCN基础见4.1、4.2)。即进行知识图谱的编码表示

节点特征更新:


GCN节点特征更新

其中,N(v) denote v's neighborhood which consist of pairs of node u and the connected relation r
(2)式提取了和节点v相接的所有周围边与节点的特征,(3)式利用(2)式得到的周围特征完成v节点特征的更新

结构特征更新:


GCN结构特征更新

比较简单,直接利用线性变换进行更新

注意,文章认为从一个庞大的知识图谱中进行推理太复杂,所以它从输入的语料抽取source concepts得到一个子知识图谱然后再推理。对应原文:The sub-graph consists of inter-connected H-hop paths starting from the source concepts Cx extracted from the input text.

  1. use GPT-2 to model the sequence。GPT-2使用「transformer 解码器模块」构建,一次输出一个token,一般用于实现文本生成

  2. devise a dynamic reasoning module。 this module utilizes both structural patterns of the knowledge graph(来自1) and contextual information (来自2) to propagate evidence along relational paths,即利用知识图谱的信息 + 文本的上下文信息进行推理。推理结果通过节点分数score来确定

    首先,初始化知识图谱G各个节点的分值——Initially, nodes correspond to the concepts in Cx are given a score of 1 while other unvisited nodes are assigned with 0.

    然后,通过 multi-hop reasoning on the relational paths on G 更新节点分值。对于知识图谱G,利用已经访问过的节点来更新未访问的邻接节点的得分,多跳直到访问完G中所有节点,实现对所有节点的得分更新。对应原文:Specifically, the module broadcasts information on G,by updating the score of outer nodes with their visited neighbours,for multiple hops until all the nodes on G are visited.

ns(v)表示节点v的score,则


更新score公式

最后,对所有节点的score做softmax归一化,得到concepts distribution

  1. final generation distribution with gate control。【知识图谱的concepts distribution】和【直接decode hidden state得到的仅基于输入语料的standard vocabulary distribution】的加权分布作为最终的输出分布,确定next token

4.相关知识基础

4.1 Graph

设图G=(V, E),则图数据的特征分为

  • 1) 节点特征:节点自身的信息——点特征,即V本身的特征

  • 2) 结构特征:节点与节点之间的关联特征——边特征,即E本身的特征

4.2 GCN(Graph Convolutional Network)

介绍见https://zhuanlan.zhihu.com/p/37091549

5.实验

5.1三个实验
  • Story Ending Generation (SEG) ——预测故事结局
  • Abductive NLG (αNLG) ——预测因果关联
  • Explanation Generation (EG) ——解释反事实
5.2 Extracting Sub-Graphs as Knowledge Grounding

从input中抽取概念形成子知识图谱,主要步骤如下

  • 选择knowledge base。use 【ConceptNet 】(Speer and Havasi, 2012) as the commonsense knowledge base.
  • 基于字符串匹配的形式提取input sequence中的concept。perform fuzzy matching with the lemmatized form of the surface texts using Spacy3 and filter out stop words,to recognize concepts from the input text sequence base on 【ConceptNet 】
  • 建立子知识图谱(重要)。从当前子图中的节点出发(由来自input sequence的concepts初始化),基于三元组关系搜索每个节点的直接邻居作为潜在节点,不断纳入incoming degree达到要求的节点来扩大子图。直观上看,这样的建图算法保留了概念间最常用的知识联系
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,245评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,749评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,960评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,575评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,668评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,670评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,664评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,422评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,864评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,178评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,340评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,015评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,646评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,265评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,494评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,261评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,206评论 2 352

推荐阅读更多精彩内容