产品 | 知识图谱落地应用:智能问答

[ 相关笔记 ]

产品 | 知识图谱落地应用:搜索

产品 | 知识图谱落地应用:推荐

产品 | 知识图谱落地应用:金融投资领域

前面两篇分别介绍了知识图谱在搜索和推荐中的应用,接下来继续介绍知识图谱在“智能对话”中的应用。

3. 智能问答

从20世纪80年代的手柄/按键/遥控交互,到2007年iphone带来的触摸交互,再到2015年echo诞生带来的语音交互,可以发现,人机交互方式越来越接近以视觉+自然语言为主的人人交互方式(未来也可能是视觉、表情、手势等的隔空交互),人机交互不再是人服从机器,而是机器服从人。知识图谱在这些变革中也具有重要的应用场景,下面分两部分介绍:一是对话系统的基本框架介绍;二是知识图谱在智能问答中的应用。

3.1 关于对话系统

从具体应用场景来看,当前对话系统解决的典型问题有三种:任务型Task、问答型QA、闲聊型Chat。

a. 任务型:主要目的是依照用户意图收集必要的信息以协助用户完成任务或操作

e.g. 帮我订一张从北京到广州的高铁票;帮我打开空调

b. 问答型:主要目的是检索并为用户提出的自然语言问题提供答案

e.g. 忘记密码怎么办?奥巴马出生在哪?

c. 闲聊型:主要目的是满足用户的情感需求,拉近与用户的距离

e.g. 我今天心情不好、你太傻了

如果让我们来设计一个对话系统,通常需要考虑六大部分:

参见朱鹏臻《人工智能产品经理:人机对话系统设计逻辑探究》

[ 语音识别ASR ] 将原始的语音信号转换为文本信息

[ 自然语言理解NLU ] 将识别出来的文本信息转换为机器可以理解的语义表示

[ 对话管理DM ] 根据NLU模块输出的语义表示执行对话状态的跟踪,并根据一定的策略选择相应的候选动作。包括对话状态跟踪DST和候选动作选择Pollcy两部分

[ 自然语言生成NLG ] 负责生成需要回复给用户的自然语言文本

[ 语音合成TTS ] 将自然语言文本转换成语音输出给用户

[ 知识Knowledge ] 对话任务的完成离不开知识,不论是任务型中的意图及参数,问题型中的知识库,还是闲聊中的语料都属于知识(但是知识并不一定只有这三类)。对话系统结合知识后,能够形成完善的对话交互框架。

注意:有的对话交互框架中并不包含语音部分,回复给用户的也不一定是语音,可能是打电话或发送信息等,因此语音识别ASR、自然语言生成NLG、语音合成TTS是非必需的。

示例:假如你跟小助手说:“给我订一张明天的高铁票”,那么其简化的处理流程可能是:

3.2 知识图谱在对话系统中的应用

从对话系统各个模块(ASR/NLU/DM/NLG/TTS/知识库)来看,知识图谱落地主要在“知识库”模块,侧重“问答型”需求场景,接下来主要介绍知识图谱在“问答型”问题中的应用,其他模块后续接触到再补充。

(1)“问答型”需求的答案是否都来自同类型的知识库?

在智能问答任务中,不同类型的问题通常需要基于不同类型的问答知识库生成答案。根据所使用问答知识库类型的不同,可分为四大类:

a. 知识图谱问答:使用知识图谱作为问答知识库,问题的答案可以来自知识图谱的实体集合,也可以基于知识图谱推理出来的内容。

b. 表格问答:使用从互联网上抓取得到的表格集合作为问答知识库,问题的答案既可以是某个表格,也可以是基于表格推理得到的内容。

c. 文本问答:使用无结构文本作为问答知识库,问题的答案既可以是输入文本中的句子,也可以是输入文本中的单词或短语。前者对应答案句子选择任务,其核心目标是计算问题和答案句子候选之间的相关性;后者对应机器阅读理解任务,其核心目标是根据问题定位答案在输入文本中的起始和终止位置。

d. 社区问答:使用从社区问答网站上抓取的<问题,答案>对作为问答知识库,问题的答案来自于和输入问题语义最为匹配的已有问题对应的答案。该类任务的核心目标之一是计算问题和已有问题之间的相似度。

(2)什么场景下适合基于知识图谱对话?(参考段楠《智能对话》中对问题的分类)

a. 事实类(factoid)问题

用户的问题通常比较客观,对应的答案是现实世界中的一个或多个实体,例如问题“金庸是哪里人”,对应的答案是地点类型实体“浙江嘉兴”。

b. 是非类(yes/no)问题

用户问题对应的答案是yes或no。例如问题“天空是红的吗”

c. 定义类(definition)问题

用户提问的模式相对固定,对应的答案是关于问题中提到的某个实体的术语解释,例如“谷歌知识图谱是什么”,对应的答案是“谷歌知识图谱”的术语解释。

d. 列表类(list)问题

用户问题对应的答案通常是一个集合,例如“list of highest mountains on earth”

others:

比较类、意见类和指导类问题,由于对应的答案较为主观,不适合基于知识图谱返回答案,而是通常基于来自问答社区网站的<问题,答案>对来进行解答。

e. 系统主动会话

还有一种场景,VUI(Voice User Interface)交互下,存在用户浏览内容的缺陷,使得产品的很多功能无法被用户感知。通过知识图谱,推荐相同实体下的其他关系/属性或者相同关系下的其他实体等,有助于引导用户发现产品功能or提高用户对产品智能化的感知。

(3)基于知识图谱的问答是如何实现的

该类任务可以采用语义分析和答案排序两种方法完成。

方法1. 语义分析:首先将输入问题转化为知识图谱能够理解的语义表示进行查询,然后据此从知识图谱中检索得到问题对应的答案。

方法2. 答案排序:首先根据输入问题从知识图谱中筛选得到答案实体候选集合,然后通过对不同答案实体候选进行打分和排序,得到问题对应的答案。

两种方法的具体实现原理可参见段楠《智能问答》。

以下是一个简单的示例。给定问题where was Barack Obama born?,首先采用实体链接(entity linking)技术识别出问题实体Barack Obama→然后采用关系分类(relation classification)技术识别出问题所表达的谓词关系PlaceOfBirth→根据实体链接和关系分类的结果生成问题对应的语义表示→根据语义分析结果从知识图谱中推理得到问题对应的答案实体Honolulu。

[ Reference ]

1. 朱鹏臻 | 人工智能产品经理:人机对话系统设计逻辑探究(豆瓣)

2. 段楠 | 智能问答 (豆瓣)

3. 刘升平 | 知性会话:基于知识图谱的人机对话系统方法与实践(CSDN)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容

  • 前面的文章主要从理论的角度介绍了自然语言人机对话系统所可能涉及到的多个领域的经典模型和基础知识。这篇文章,甚至之后...
    我偏笑_NSNirvana阅读 13,895评论 2 64
  • 什么是知识图谱? 知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知...
    郭少悲阅读 20,519评论 2 34
  • 知识图谱技术 知识图谱(Knowledge Graph,KG)描述客观世界的概念、实体、事件及其之间的关系。其中,...
    sennchi阅读 5,266评论 0 17
  • 知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document级别降到...
    姜雄_20e9阅读 17,495评论 0 35
  • 这篇文章主要参考了[1]刘峤,李杨,段宏,刘瑶,秦志光. 知识图谱构建技术综述[J]. 计算机研究与发展,2016...
    我偏笑_NSNirvana阅读 52,497评论 6 125