知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网信息表达成更接近人类认知世界的形式,目前主要应用于搜索、推荐、智能问答等领域,接下来会简要整理目前主要的KG落地应用。
[ 相关笔记 ]
1. 搜索
知识图谱技术最先应用于搜索,最初由谷歌公司在2012年5月提出(2012年5月17日,谷歌发布知识图谱项目,并宣布以此为基础构建下一代智能化搜索引擎)。知识图谱技术在搜索的落地包括:
a. 语义搜索:实现Web从网页链接向概念链接转变,支持用户按主题而不是字符串检索
b. 关系搜索:获取两个实体之间的关系,例如公司之间的关系、人物之间的关系等
c. 结构化展现:以图形化方式向用户展示经过分类整理的结构化知识,从而使人们从人工过滤网页寻找答案的模式中解脱出来
1.1 语义搜索
a. 关键词增强型
[ 原理 ] 核心仍然是传统的搜索引擎,知识图谱技术以多种途径被用来增强关键词搜索,以此来改善搜索的查全率和查准率。基本原理是事先定义词的同义词、上下位词等词集合,当关键词被检索时,其他与该关键词相关的词也通过图搜索的方式也被检索出来,用来扩展或约束搜索
[ 场景 ] 更加全面、准确的查找自己需要的信息
[ 落地 ] 谷歌、百度等
e.g 在谷歌中搜“西红柿”,可以检索到“番茄”的相关结果(不一定是用KG技术实现的,但基本意思是这样)
b. 答案检索型
[ 原理 ] 对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在知识图谱中查询答案
[ 场景 ] 直接找到问题的答案,而非大量的网页链接
[ 落地 ] 谷歌、百度等(部分查询)
e.g.1 在百度搜索“阿里巴巴市值”,结果list中的第一条直接返回答案
e.g.2 在百度中搜索“马云的妻子的儿子”(不一定是用KG技术实现的,但基本意思是这样),结果list中的第一条直接返回答案
1.2 关系搜索
[ 场景 ] 快速准确地查询两个实体之间的关系
[ 落地 ] 天眼查、全历史
1.3 结构化展现
系统收集信息,建立知识库,用户通过图形用户接口(可视化的本体概念树)或关键词提交查询,系统返回用户所查找概念的所有实例
[ 场景1 ] 快速有效地检索出某个概念的所有实例
例如:天眼查、全历史、Magi
e.g.1 在天眼查(网页)中搜索“腾讯公司”,可查看与该公司有关系的实例(法人、分支机构等)
e.g.2 在全历史(app)关系图谱模块点击“秦始皇”,系统返回秦始皇相关的实例(亲情、敌对、成就等),再依次点击“成就--韩国”,可查看秦始皇灭掉韩国的成就
e.g.3 在Magi中搜索“智能问答”,返回对应的实体、关系及属性等信息
[ 场景2 ] 解决一词多义的情况
通常情况下,词语只有在特定的语境之下才能表达出精确的意思,单独搜索某个词语经常会面临一词多义的情况。 例如“苹果”可以是一种水果,也可以是科技公司、手机、电脑;泰姬陵( Taj Mahal) 既可以指一个遗迹,也可以指一个音乐家。如果我们在谷歌中搜索“泰姬陵 ”,在右侧,谷歌会给出泰姬陵的地图及相关介绍,也会在下方将同名的条目列出来。借助知识图谱, 谷歌可以理解实体和实体含义间的细微差别,并且将所有可能的结果归纳分组,让检索更加智能。