Template-based Question Answering over RDF Data 笔记

一、摘要

先引入问题。由于数据的大量增长,采用直观的途径获取信息越来越重要,问答系统是一个既满足直观性又满足表达能力的折衷方案。

然后介绍通用的做法,有什么难点。将问题转化问rdf三元组,去知识库中检索答案,该方式不能很好的表示自然语言问题的语义,很多问题回答不了。

接着介绍本文的方法。对问题进行深层语义解析,产生一个sparql查询模板,该模板能完整的映射问题的语义结构。利用统计实体识别和谓词检测等方法填充模板中的槽。

最后表明本系统的回答问题的能力要优于其他系统。

二、介绍

先介绍通常情况的问答解析思路,把问题转化为N个三元组来表示,然后去知识库中检索。

然后举了几个把问题转换成sparql模板的例子,重点描述了含有more than、most的例子。

三、模板生成

利用Pythia,通过借助领域无关词库和领域相关词库产生自然语言问题的句法树(词汇化邻接树算法)和语义表示。

四、实体识别

名词短语和名词采用通用的识别算法(字串相似度)。谓词检测采用知识库和BOA pattern结合的方法,定义support、typicity和specificity给谓词打分,得分最高的就是最佳谓词表达式(自然语言问题)—谓词(知识库)的映射关系。

五、query排序与查询

经过三、四两个环节会产生多个spraql查询,根据相似性分数和显著性分数,以及类型一致性检查、空结果剔除等方法,获得合适的query。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 前面的文章主要从理论的角度介绍了自然语言人机对话系统所可能涉及到的多个领域的经典模型和基础知识。这篇文章,甚至之后...
    我偏笑_NSNirvana阅读 14,050评论 2 64
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,908评论 18 139
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 173,228评论 25 708
  • 知识图谱(Knowledge Graph)是当前学术界和企业界的研究热点。中文知识图谱的构建对中文信息处理和中文信...
    苟雨阅读 7,477评论 0 11
  • 每天用25分钟学习一项技能,
    高刚高刚阅读 85评论 0 0