构成这个世界的是实体,而非字符串。--Google
概览:
互联网时代,人们在开采过程中与提升机交互中产生了异常庞大的数据,这些数据中包含了大量描述提升机故障,安全知识,量产量销等等大量的信息。如何将这些信息有效组织起来,进行结构化的存储,就是知识图谱的内容。
什么是知识表示?
1. 知识表示通常由大量的本体论约定的概念和实体组成,通过某一种有效的方式组织起来,使得知识系统能够得以搭建并支持高效的知识推理,方便人们表达和分享对世界的认知。
建立于1988年的知网(Hownet)是一个典型的语义网络,它由董振东教授建立,感兴趣的同学可以关注下。董振东教授认为知识库或者知识图谱的构建应该首先由知识工程师设计好完备的知识框架,再由相关领域的专家填充领域知识,是一种典型的自顶向下的构建模式。
知识表示就是对知识的一种描述,或者说是对知识的一组约定,一种计算机可以接受的用于描述知识的数据结构。它是机器通往智能的基础,使得机器可以像人一样运用知识。 本质上,知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。
三元组是知识图谱的一种通用表示方式,即G=(E1,R,E2),其中:
G:表示知识图谱
E:表示知识图谱中的实体
R:表示知识图谱中的关系。用来连接两个实体,刻画它们之间的关联
2. 知识图谱中的知识表示方法:
总体来说,就是以本体为核心,以RDF的三元组模式为基础框架,但更多的体现实体、类别、属性、关系等多颗粒度多层次的语义关系。
本体,所谓本体,实际上就是知识图谱中的一个概念,它用一些属性或特征,描述了客观世界某一类事物的共性特征;并通过“关系”描述它与其他本体之间的关系。
例如: 本体“作家”,有“代表作”,“获奖”等属性,与本体“艺术家”属于“从属关系”。
3.在知识图谱中,知识表示有知识定义(知识体系)与知识实例两个层面。
知识定义(知识体系)描述了本体以及本体之间的关系,是上层建筑。
知识实例是本体的一个一个实例,对应的是真实的数据存储层。
此外,因为知识图谱最重要的功能就是实现知识推理,进行语义计算。为此,一些知识的数值化表示方法的研究开始出现。基于数值化的知识表示,有利于知识推理,但目前仅处于研究阶段,感兴趣的同学可以自行搜索学习。
总结
知识图谱是人工智能技术最重要的基础设施,是计算机能够实现推理、预测等类似人类思考能力的关键。在知识图谱中,如何有效表示现实世界中的知识,就是知识表示的内容。知识表示的研究由来已久,在如今的知识图谱领域,基于语义网的框架(三元组)来表示知识。
一些数据表示方式:
1. 独热表示:one-hot representation
2. 知识表示方式。。。
知识表示学习的几个代表模型:
1. 距离模型
2.单层神经网络模型
3.能量模型
4.双线性模型
5.张量神经网络模型
6.矩阵分解模型
7.翻译模型
RDF:resource description framework 利用web标识符来标识事物,通过指定的属性和相应的值描述资源的性质或资源之间的关系。
RDF的基本数据模型包括资源、属性和陈述。
资源(resource):一切能够以RDF描述的对象都叫资源,用唯一的URI来表示。
属性(property):用来描述资源的特征或资源之间的关系,每一个属性都有特定的意义。
陈述(statement):特定的资源加上一个属性和相应的属性值就是一个陈述,其中资源是主体(subject), 属性是谓词(predicate),属性值是客体(object)。
RDF Schema
RDFS是RDF的扩展,它在RDF的基础上提供了一组建模原语,用来描述类、属性以及它们之间的关系。
Class, subClassOf:描述类别层次结构。
Property, subPropertyOf:描述属性层次结构。
domain, range:声明属性所应用的资源类和属性值类。
type:声明一个资源是一个类的实例。
资料来源:
论文: