登录注册写文章

开放领域问答泛读系列（二）—— Denoising Distantly Supervised Open-Domain Question Answering 阅读笔记

开放领域问答泛读系列（二）—— Denoising Distantly Supervised Open-Domain Question Answering 阅读笔记

一、写在前面的话

上一篇文章提到，针对目前的开放域问答任务都是严重依赖于提前准备好的文章和段落，而不是如同日常生活中海量的文章这一问题，陈丹琦提出了一种开放域自动问答系统(DrQA)。DrQA整体分为两部分，Document Retriever用于从海量文章中搜寻相关文章，Document Reader对这些相关文章的段落做精读。但Document Retriever很有可能会引入存在问题提及的信息但其实和问题并不相关的噪声段落，故本篇文章在DrQA对该部分进行了排序，即对每个段落给出一个与问题相关的权重。

二、论文模型

2.1 整体架构

模型可以分成段落选择器（Paragraph Selector）和段落阅读器（Paragraph Reader）两部分，Paragraph Selector用于生成给定问题时，每个段落与该问题的相关权重。Paragraph Reader则用于生成每个段落中能获得答案的概率。（PS：图中给出Paragraph Selector是做了粗筛，但实际好像并没有去掉段落，而是给出了权重）

2.2 Paragraph Selector

使用循环神经网络（RNN）对问题和段落进行了编码（论文这边还给出了MLP进行编码，后面实验证明MLP效果不行）：

对问题𝑞做了self attention：

通过交互、池化和softmax求的概率:

2.3 Paragraph Reader

这一块可以和Paragraph Selector分开来看，视为两个独立的模型。

做和Paragraph Selector一样的编码，得到：

对每个段落的词对预测一个是答案开始的概率和是答案结束的概率：

统计2中的结果，对每个段落得到出其包含答案的概率（有MAX和SUM两种方法）：

MAX

SUM

2.4 损失函数

论文中给出了一个 $\text{Pr}(a|q,P)$ 的对数损失加上对段落选择器的正则部分：

$L(\theta) = - \sum \text{Pr}(a|q,P)-\alpha R(P)$

段落选择器的正则部分（即R(P)）:

$R(P)=\sum_{p_i \in P}\chi_i \log\frac{\chi_i}{\text{Pr}(p_i|q,P)}$

其中 $\chi_i = \frac{1}{c_P}$

三、实验结果

整体来看有不错的提高，但是论文看下来没感觉有哪些地方能特别帮助提高，后续会做下实验看看效果。

最后编辑于：2020.01.11 13:02:58

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

开放领域问答泛读系列（一）—— Reading Wikipedia to Answer Ope...
一、写在前面的话该论文考虑的问题是如何使用Wikipedia作为唯一知识源回答开放领域的事实型问题，就像人们在百...
DataArk阅读 1,140评论 0赞 0
浅谈智能搜索和对话式OS
前面的文章主要从理论的角度介绍了自然语言人机对话系统所可能涉及到的多个领域的经典模型和基础知识。这篇文章，甚至之后...
我偏笑_NSNirvana阅读 14,116评论 2赞 64
电子商务网站开发与建设
概要 64学时 3.5学分章节安排电子商务网站概况 HTML5+CSS3 JavaScript Node 电子...
阿啊阿吖丁阅读 9,355评论 0赞 3
2016年5月Swift 2 学习 --- 117个注意事项与要点
这是16年5月份编辑的一份比较杂乱适合自己观看的学习记录文档，今天18年5月份再次想写文章，发现简书还为我保存起的...
Jenaral阅读 2,876评论 2赞 9
[中/英双语] Andrej Karpathy：A Survival Guide to a P...
接上文：[中/英双语] Andrej Karpathy：A Survival Guide to a PhD （一）...
zhwhong阅读 1,670评论 2赞 1

赞1赞

赞赏

手机看全文