1、体系架构
知识图谱体系架构分为3个部分:
- 第一部分是源数据的获取,即在各个类型的数据中获取有用的资源信息;
- 第二部分是知识融合,用于关联多数据源的知识,扩大知识范围;
-
第三部分是知识计算与知识应用,知识计算是知识图谱能力输出的主要方式,而知识应用是将知识图谱与特定领域或业务相结合,从而提高业务效率。
2、关键说明
2.1 实体链接
实体链接(Entity Linking),也叫实体链指,是一种任务,它要求我们将非结构化数据中的表示实体的词语(即所谓mention,对某个实体的指称项)识别出来,并将从知识库(领域词库,知识图谱等)中找到mention所表示的那一个实体。完成实体链接任务所需要的技术,叫做实体链接技术。
参考 https://zhuanlan.zhihu.com/p/166168245
2.2 本体概念层/本体集成/本体映射/本体推理
本体:指对概念、数据和实体之间的类别、属性和关系的表示、命名和定义。本体提供的是特定领域之中那些存在着的对象类型或概念及其属性和相互关系。代表某一领域的抽象。
本体集成:直接将多个本体合并为一个大本体。
本体映射:寻找本体间的映射规则。
本体推理:基于本体的推理是利用本体已经蕴含的语义和逻辑,来对实体类型以及实体之间的关系进行推理。本体的描述形式是有规范的。RDFS、OWL等是一类满足特定规范和讲究的用来表述本体的语言。
知识图谱的概念模型可划分为本体层和实例层。其中,本体层由实体类型和其属性、 实体类型间关系类型、规则等本体相关知识元素构成;实例层是对本体层的实例化,由实体类型对应 的实体及其属性以及实体间关系等实体相关知识元素构成。 上图中知识图谱概念模式的主体是实体。实体是真实对象的抽象,实体类型是某类实体的进一 步抽象。基于不同层次的抽象,图中的本体层和与实例层是相对的。构建某个知识领域的某个层次的 特定知识图谱时,“实体”这个抽象称呼将使用所关注的特定对象的具体名称取代。图中名为“属性” 的两个方框是分别针对本体层的所有实体类型和实例层的所有实体。本体层的“属性”是指对应实体 类型的属性,各个属性是概括性描述;实体层的“属性”是指对应实体的属性,是某实体类型实例的 属性的具体描述。同时,多个实体和关系的组合可以构成新的复杂实体,如:由时间、人物、地点等 要素构成的事件,由不同模块构成的产品等。
2.3 知识计算
知识计算是一种新的计算模式,利用AI技术实现机器将知识转化成可计算的模型。 具体来说,知识计算将行业中各种形态的知识,以数学模型的方式,协同行业数据进行计算。 将该过程中所涉及的方法和能力纳入知识计算框架当中,为行业实现智能化转型升级提供有力支撑。 随着AI技术的高速发展,AI在行业中的应用逐步进入快车道。