[论文笔记] AAAI 2019 | Hybrid Attention-Based Prototypical Networks

会议:AAAI 2019
论文链接:https://gaotianyu1350.github.io/assets/aaai2019_hatt_paper.pdf
源码链接:https://github.com/thunlp/HATT-Proto

1 介绍

问题现状:使用 DS 可获取大量数据,但其范围比较局限,还存在稀疏数据的问题(例如,long-tail relations);现有的 FSL 模型都在 low-noise 的图像数据集上实验,无法处理多样性和含有较多噪声的文本数据。
(1)噪声数据:支持集中很少的噪声可以引起关系特征向量的巨大偏差(因为传统的原型由样本特征的简单平均算出)
(2)稀疏特征:对于一个关系特征向量,并不是所有的维度都对最终的分类结果具有明显的区分/决定作用。
本文方法:提出了基于混合注意力机制的原型网络(hybrid attention-based prototypical networks),包括 instance-level attentionfeature-level attention,分别解决上述两个问题;该方法提高了在含有噪声的 FSL 场景下(noisy FSL scenario)关系分类(RC)模型的性能与鲁棒性,并且加快了 RC 模型的收敛。

N-way K-shot

原文相关描述如下:

Little noise in the support set may cause a huge deviation of relation features, and not all dimensions of relation features in the space are discrimiative enough to support final classification. Our hybrid attentions are specially designed to alleviate the influence of noisy data and sparse features.

  • The instance-level attention module is to select more informative instances in the support set and denoise those noisy instances during training.
  • The feature-level attention module can highlight important dimensions in the feature space and formulate specific distance functions for different relations, which enables our model to alleviate the problem of feature sparsity.

instance-level attention 倾向于选择支持集中包含信息较多的那些实例,同时对训练数据进行降噪处理(降低噪声实例的权重);feature-level attention 则强调了特征空间中比较重要的那些维度,为不同的关系类型制定不同的距离函数,从而缓解了特征稀疏的问题。

2 相关工作

关系分类
小样本学习

3 方法论

3.1 符号与定义

小样本关系分类任务描述:给定一个关系集 R 和一个支持集 S,预测查询样本(query instance)x 中的实体对 (h, t) 之间的关系 rS 的定义如下:

在小样本学习的场景下,关系 ri 所包含的样本数量 ni 通常较小(一般小于20)。在术语 N-way K-shot 中,N 表示一个 episode 中支持集有多少个关系,K 表示每个关系包含多少个样本,即:

3.2 框架

3.3 HATT的实现

由于 Instance Encoder 和 Prototypical Networks 的实现比较简单,该笔记暂时略过,下面详细介绍 HATT 的实现步骤。

3.3.1 Instance-level Attention(IATT)

对于关系 i,其样本数量为 ni,其原型的特征向量为 cij 表示第 i 个关系中第 j 个样本(1 ≤ j ≤ ni),αj 表示第 j 个样本的权重, xij 表示第 i 个关系中第 j 个样本经过编码后得到的特征向量。公式如下:

αj 由Softmax函数得到(ej 作为相应的参数);x 为 query 样本的特征向量,g(·) 表示对 xijx 进行线性变换,再进行点乘操作(element-wise production),σ(·) 为激活函数,这里选用 tanh,将点乘结果映射到 [-1, 1] 之间,sum{·} 表示对向量里的所有元素求和。详细公式如下:

使用了 IATT 后,与 query 样本具有更多相似特征的 support 样本将会获得更高的权重,最后的原型也会与这些 support 样本更接近。

3.3.2 Feature-level Attention(FATT)

在 Euclidean 距离的基础上,乘以一个值 zi,得到一个新的距离度量,公式如下:

对于关系 ri,对其 K 个样本的特征向量进行 3 次卷积操作,得到 zi,具体计算流程如下图所示:

注意,卷积时采用了 padding 策略,以此来保证最终得到的 zi 大小为 1 * dh * 1。卷积操作的参数设置代码如下:

4 实验

为了表明混合注意力机制在有噪声数据的情况下能够让网络有较好的鲁棒性,我们采用了 4 个级别的 noise_rate:0、10%、30%、50%,也就是说,在训练和测试时,support set 中正确的句子有相应噪声率的可能性被替换成其他句子,该其他句子的 label 与原 label 不一样即可。

# 返回一个或一组服从0~1均匀分布的随机样本值
prob = np.random.rand()
if prob < noise_rate:
    # 替换操作

4.1 结果

4.2 IATT的影响

4.3 FATT的影响

5 未来工作

将混合注意力机制与其他 FSL 模型结合,并且使用更多的神经网络编码器,来让我们的模型更具有一般性。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342