最近几年知识图谱作为人工智能领域很热门的一项技术,已经在不少领域都取得了不少成功的落地案例。不过知识图谱作为人工智能的一个底层技术,确实不如图像,语音等技术一样让人能很直观的感受到它的存在。于是乎,总会被问道:知识图谱到底能干啥?所以就来写一篇文章,来说一下我的一些认识。不涉及技术细节,就用简单来讲讲基本的概念原理。
文章将会从知识图谱是什么?知识图谱有什么特性?基于知识图谱的特性能干什么事?有哪些典型的应用。
一 什么是知识图谱
知识图谱是一种大规模的语义网络(这是比较正式的定义),通俗的来讲可以理解为,知识图谱是对现实世界的一种抽象描述,把事物表示成“点”,把事物之间的关系表示成“边”,这样就构成了一张网。事物的固有“属性”也可以被表示成“边”,属性值是另一头的点。这里的“大规模”,强调的是一种量变到质变。 只有有足够丰富的节点和关系,才能体现出知识图谱的能力。
二 知识图谱有什么特性
知识图谱的结构决定了知识图谱具有以下的特性。
1.统一的结构化的表现形式,机器可读,对人类友好。
2.含有丰富的语义信息,概念,属性,实体之间关系。
3.构建之后可以作为背景知识直接供下游应用使用。
4.丰富关联信息,天然具有图的各种特征,可以进行图的相关操作。
三 知识图谱的作用
上面已经说了知识图谱的特性,那现在算是要回答上面的 问题了。我们可以从特性出发来回答这个问题。不过其实很多应用其实都是会综合的运用图谱的不同特性。我这里就根据每一种特性
1.把领域中异构的知识结构化,构建知识间关联。主要解决领域内数据分散在多个系统,数据多样、复杂,孤岛化,且单一数据价值不高的应用场景。很显然结构化的知识,天然的把领域知识做了显性化沉淀和关联。构建起来了一张图。可以利用原生图的特征,支撑数据的挖掘,分析。
主要应用:
1).做关系发展,实体探索,借助于图可视化工具发现一些潜在信息,潜在的关联。利用这些信息,来辅助决策。主要涉及的技术点:1.前端ui设计,前端图渲染技术。结合业务需求的定制化图展示(出于业务分析目的,按一定的属性,类型等约束进行展示)2.路径查询,探索多个实体间的路径关系。典型的产品:天眼查
2).社团发现
发现一些相似的实体。广泛用于团伙发现,同类推荐场景。广泛用于金融行业反欺诈场景,社交推荐。主要技术点:社团搜索
3).追溯源头
将多方数据打通,基于图中的边做拓展,即可实现源头的追溯。
2.使能机器语言认知
知识图谱有丰富的语义关系,概念,属性,关系等这些语义关系可以很好的应用到nlp相关任务上,例如分词,短语理解,文本理解等任务上。通过知识图谱可以让机器能更好的去理解自然语言,进一步的更好的理解用户的意图,文本的含义。
主要应用:
1).基础nlp任务,例如分词,文本理解;
2).对用户画像数据,对各种标签数据做数据增强。
3).搜索,问答的意图理解,推荐的用户,物品的理解;
3.提供行业背景知识。做知识引导,解决问题。
应用:垂直领域内的深度应用,比如智能客服系统,智能外呼系统利用知识图谱可以精准的回答用户的问题,可以进行复杂问题的回答。一些垂直行业内常用的传统专家系统,通过赋予他们一定的背景知识,可以很好的提升效果。
4.知识图谱使能可解释人工智能
可解释,是强人工智能的一个重要特征。当前以深度学习模型为主的人工智能应用,虽然从结果上看效果还不错。但是模型本身就是一个黑盒的不具备可解释性,这就导致在很多需要有解释性的行业,没法使用复杂的深度学习模型。比如在司法领域,医疗诊断领域,金融领域某系场景。
可解释性的应用也会很好的提升用户对系统的信任感,提升用户满意度。问答场景下,推荐场景下都可以加入解释功能。
应用:尤其是在司法,医疗领域
5.其他应用
基于知识图谱的推理,综合利用图谱中的概念上下位关系、属性类型及约束、图模型中实体间的关联关系,结合业务场景定义的关系推理规则等。可以用来做一些不一致性检测、推断补全,知识发现,商品溯源,辅助推理决策等各类推理应用。
先写到这儿吧,然后挖个坑,后面具体结合行业场景,来分行业讲讲具体在不同行业中的应用。