论文阅读—A Multi-turn Machine Reading Comprehension Framework with Rethink-Mechanism for Emotion-Caus...

A Multi-turn Machine Reading Comprehension Framework with Rethink-Mechanism for Emotion-Cause Pair Extraction.

论文地址:https://export.arxiv.org/pdf/2209.07972v1.pdf

github:https://github.com/zhoucz97/ECPE-MM-R


问题与背景

1 情感原因对提取(ECPE)是情感原因分析中的一项新兴任务,它从情感文档中提取潜在的情感原因对。

2 大多数最近的研究使用端到端(end-to-end)的方法来处理ECPE任务。这些方法要么存在标签稀疏性(label sparsity )问题,要么无法对情感和原因之间的复杂关系进行建模。

3 大多数都没有考虑子句的明确语义信息(explict semantic information)。

解决办法

将ECPE任务转换为文档级机器阅读理解(MRC)任务,并提出了一个具有重新思考机制的多回合MRC框架(MM-R)。

我们的框架可以对情感和原因之间的复杂关系进行建模,同时避免生成配对矩阵(标签稀疏性问题的主要原因)。

为了应对这些挑战,本研究将ECPE任务转化为文档级机器阅读理解(MRC)任务,并提出了一个具有重新思考机制的多回合MRC框架(MM-R)。多回合结构对ECPE任务进行分解,以对情绪和原因之间的对应关系进行建模,并避免生成配对矩阵。

在每一个环节中,手动设计的静态和动态查询都充分利用了子句的明确语义信息,以提高情感或原因提取的性能。

相关研究

Emotion-Cause Pair Extraction

目前的趋势是使用端到端的方法来解决ECPE任务和两个子任务,情绪提取和原因提取,这两个子任务旨在在一个文档中提取所有情绪和原因。这些端到端的方法可以分为两类:

 对级方法(pair-level methods)将所有子句对组合起来形成子句配对矩阵;

 通过设计新的标记方案来实现序列标记方法(sequence labeling methods)。

(Ding et al.,2020a,b;Wei et al.,2020;Chen等人,2020b;Wu等人,2020)提出了配对级(pair-level)方法,该方法通过枚举子句的所有可能组合来生成配对矩阵,然后选择有效的情绪-原因对,如图1(b)所示

此外,受人类两阶段阅读行为的启发,(Zheng et al.,2019),提出了重新思考机制(rethink mechanism)来进一步验证候选情绪-原因对,以增强情绪和原因之间的信息流,提高整体表现。

Machine Reading Comprehension

Liu等人(2020)将事件提取视为一个机器阅读理解问题,以解决数据稀缺问题。Chen等人(2021)和Mao等人(2021)分别提出了双向MRC和双MRC框架来处理基于方面的情感分析。本文将ECPE任务形式化为文档级MRC任务,并提出了具有重新思考机制的多回合MRC框架。


Zixiang Ding, Rui Xia, and Jianfei Yu. 2020a. Ecpe2d: Emotion-cause pair extraction based on joint two-dimensional representation, interaction and prediction. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 3161–3170.

Jian Liu, Yubo Chen, Kang Liu, Wei Bi, and Xiaojiang Liu. 2020. Event extraction as machine reading comprehension. In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 1641–1651.

Yue Mao, Yi Shen, Chao Yu, and Longjun Cai.2021.Ajoint training dual-mrc framework for aspect based sentiment analysis. In Proceedings of the AAAI Con- ference on Artifciallntelligence, volume 35, pages 13543-13551

案例

例如,如图1(c)所示,情绪分句c2和c4可以在第一轮中获得,而与每个情绪分句对应的原因分句可以在第二轮中获得。因此,可以在没有配对矩阵的情况下获得候选情绪-原因对集合{(c2,c3),(c2,c4),(c4,c4)}。在第三轮中,重新思考机制表明c2不是c4的相应情感从句之一。因此,有效的情绪原因对集合变为{(c2,c3),(c4,c4)}。

figure 1

过程:

在第一轮中,所有的情感子句都被提取出来;

在第二轮中,在关于情绪的明确语义信息的帮助下,提取与每个情绪子句相对应的原因子句;

第三轮中,重新思考机制验证了每个候选情绪-原因对。

实验过程

Query Design设计问句

• Static emotion query qse ∈ Qse: The query "Is it an emotion clause?"is designed to extract all emotion clauses  抽取出所有的情感句

• Static cause query qsc ∈ Qsc: The query "Is it a cause clause?"is designed to extract all cause clauses.  抽取出所有的原因句

• Static pair query qsp ∈ Qsp: The query"Is it an emotion-cause pair?"is designed to extract all emotion-cause pairs.  抽取出所有的情感原因对

• Dynamic emotion query qde ∈ Qde: The query template "Is it an emotion clause corresponding to ci?"is designed to extract emotion clauses corresponding to clause ci.

抽取出该原因句ci对应的情感句

• Dynamic cause query qdc ∈ Qdc: The query template "Is it a cause clause corresponding to ci?" is designed to extract cause clauses corresponding to clause ci.

抽取出该原因句ci对应的原因句

整体框架


figure 2

Encoding Layer

The encoding layer includes the token-level encoding layer and the clause-level encoding layer.

Token-level encoder

This study used BERT (Devlin et al., 2019) as its token-level contextualized encoder. Specifically, a document D = (c1, c2, ..., c|D|) and a query q are used to construct the BERT input sequence.

I = {[CLS], wq,1, wq,2, ..., wq,|q|, [SEP ], w1,1, w1,2, ..., w|D|,1, ..., w|D|,|c|D||},

Clause-level encoder:

The attention mechanism and the graph attention network (GAT)  (Veliˇckovi ́c et al., 2017) are used to obtain clause level hidden representations.


Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. 2019. Bert: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), pages 4171–4186.

Petar Veliˇckovi ́c, Guillem Cucurull, Arantxa Casanova, Adriana Romero, Pietro Lio, and Yoshua Bengio. 2017. Graph attention networks. arXiv preprint arXiv:1710.10903.


数据与实验评估

基准数据集(Xia and Ding,2019)是基于新浪新闻网站的公共汉语情感语料库(Gui et al.,2016)构建的。

Baselines:

• SL-NTS

• TransDGC

• ECPE-2D

• PairGCN

• RANKCP

• ECPE-MLL

Table 1

Rui Xia and Zixiang Ding. 2019. Emotion-cause pair extraction: A new task to emotion analysis in texts. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 1003–1012.


结论

本研究将情绪-原因对提取(ECPE)任务转化为机器阅读理解(MRC)任务,并提出了一种具有重新思考机制的多回合MRC(MM-R)。这种结构依次提取情绪和原因,避免了标签稀疏性问题,并对情绪和原因之间复杂的对应关系进行了建模。在每一个环节中,明确的语义信息都可以被有效地使用。此外,重新思考机制通过建模从原因到情绪的信息流来验证每个候选的情绪-原因对。在ECPE语料库上的实验结果证明了所提出的模型的有效性。

问题与思考

1 设置QA问句的方法;

2 重新思考机制(rethink mechanism)的多回合MRC(MM-R)对于设置新的任务具有启发性;

3 图2关于实验的整体设计中加入了encoding layer的作用如何?



论文英文重点细节细读(以下部分为重点详细内容)

Abstract:

Emotion-cause pair extraction (ECPE) is an emerging task in emotion cause analysis, which extracts potential emotion-cause pairs from an emotional document. Most recent studies use end-to-end methods to tackle the ECPE task.

end-to-end methods:端到端学习意味着我们用单个学习算法取代流水线,使其直接从输入到期望的输出,以克服传统方法的局限性。具体解释来自stackoverflow如下:

Traditionally, we extract pre-defined features before prediction.

data -> extracted features -> learning algorithm -> output

However, hand-engineered features limit the potential performance as some of them are poor approximation of reality and some of them throw away some information.

End-to-end learning means that we replace the pipeline with a single learning algorithm so that it goes directly from the input to the desired output to overcome limitations of the traditional approach.

data -> learning algorithm -> output

可在YouTube查看吴恩达的解释:https://youtu.be/ImUoubi_t7s

1 Introduction

To address these challenges, in this study, the ECPE task is transformed into a document-level machine reading comprehension (MRC) task, and a Multi-turn MRC framework with Rethink mechanism (MM-R) is proposed. The multi-turn structure decomposes the ECPE task to model the corresponding relation between emotions and causes and avoid generating the pairing matrix.

machine reading comprehension (MRC):机器阅读理解(MRC)是自然语言处理的一个子领域,尤其受益于这些进步。它的目标是赋予机器阅读、理解、推理和回答有关非结构化自然语言文本问题的能力,其方式比迄今为止传统的符号匹配启发式方法复杂得多。


In addition, inspired by the human two-stage reading behavior, in which search for possible answer candidates and then verify these candidates (Zheng et al., 2019), the rethink mechanism is proposed to verify candidate emotion-cause pairs further to enhance the flow of information between emotions and causes and improve the overall performance.

(Zheng et al., 2019),the rethink mechanism:在本论文中更好地理解人类在阅读理解过程中如何阅读和分配注意力,可以帮助提高 MRC 任务的性能。在这篇论文中,我们进行了一项实验室研究来调查人类在阅读理解任务中的阅读行为模式。通过分析被试的眼动数据和答案,提出了一个两阶段的阅读行为模型,第一阶段是寻找可能的答案候选人,第二阶段是通过比较和验证过程产生最终的答案。我们还发现,人的注意分配既受到问题依赖因素(例如,问题的答案和软匹配信号)的影响,也受到问题独立因素(例如,位置、 IDF 和词性标签)的影响。我们从两阶段阅读行为模型中提取特征来预测人类在阅读理解中的注意力信号,这显著提高了 MRC 任务的表现。我们的研究结果可以帮助我们理解人类阅读和信息搜索的过程,并帮助机器更好地满足用户的信息需求。   此论文地址:https://dl.acm.org/doi/abs/10.1145/3331184.3331231

2 Related Work

2.1 Emotion-Cause Pair Extraction

A unified tagging scheme (Chen et al., 2020a) could not be used on a document with multiple emotion clauses of the same emotion types because the tagging scheme was based on emotion types. Another joint tagging scheme (Yuan et al., 2020) based on the distance between the cause and the corresponding triggered emotion.

A unified tagging scheme:ECPE 现有的方法通过首先通过两个二元分类器分别提取情感和原因子句,然后训练另一个二元分类符将它们配对来解决这一任务。然而,提取的不同情绪类型的情绪原因对无法通过简单的二元分类器来区分,这限制了现有方法的适用性。此外,这种两步方法可能会出现级联错误。在本文中,为了解决第一个问题,我们为情绪和原因子句分配了情绪类型标签,以便可以很容易地区分不同情绪类型的情绪-原因对。至于第二个问题,我们将ECPE任务重新表述为一个统一的序列标记任务,它可以以端到端的方式提取多个情绪-原因对。

3.4 Encoding Layer

Clause-level encoder: The attention mechanism and the graph attention network (GAT)(Veliˇckovi ́c et al., 2017) are used to obtain clauselevel hidden representations.

Graph Attention Networks (Veliˇckovi ́c et al., 2017):我们提出了图形注意力网络(GAT),这是一种基于图形结构数据的新型神经网络架构,利用掩蔽的自我注意力层来解决基于图形卷积或其近似的现有方法的缺点。通过堆叠节点能够关注其邻域特征的层,我们能够(隐式地)为邻域中的不同节点指定不同的权重,而不需要任何类型的代价高昂的矩阵运算(例如反转)或依赖于预先了解图结构。通过这种方式,我们同时解决了基于谱的图神经网络的几个关键挑战,并使我们的模型易于应用于感应和传导问题。

GATs论文架构图

4.3 Baselines

• RANKCP (Wei et al., 2020) uses a graph attention network to model interactions between clauses and selects emotion-cause pairs by the ranking mechanism. 

RANKCP 

• ECPE-MLL (Ding et al., 2020b) extracts emotion-cause pairs based on sliding window multi-label learning. It is a state-of-the-art model of baselines.

ECPE-MLL

以上就是本论文较难的内容。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,919评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,567评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,316评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,294评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,318评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,245评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,120评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,964评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,376评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,592评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,764评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,460评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,070评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,697评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,846评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,819评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,665评论 2 354