一、关于本体
1. 本体论语义学的特点:
本体论语义学与其他人工智能理论、自然语言加工系统相比有自己的一些鲜明特点。其一,它强调对意义的处理无需通过句法分析,至少主要不是通过句法分析。在它看来,机器对意义的接受、表征、加工、生成和输出,或者说,让机器的句法加工具有语义性或意向性,靠的主要不是原先的关键词匹配,句法转换,而依赖的是对人类智能的全方位模拟。其二,本体论语义学认识到了人类心理状态具有意向性、自然语言具有语义性依赖于复杂的因素,并在这种认识的基础上形成了研究意义的一种综合性方案。在具体的工程学实践中,它关注到了意义处理中的多方面因素,即不仅仅注意到了知识性因素,而且还重视潜藏在人类智能中的非知识因素,并通过特定的方式将它们“内化”到他们所建构的人工智能系统之中。第三,本体语义学非常重视本体论图式在人类心理状态意向性、自然语言语义性中的作用,并在将这一认识成果向工程技术领域转化,进而让自然语言加工系统获得这一语义生成的重要枢纽、机制方面做了大胆探索,取得了富有启发意义的初步成果。第四,本体论语义学的确有重要的实践意义和广阔的应用前景,最重要的应用价值是它能产生文本意义表征。因为它的语义处理系统可以借助静态知识资源对输入文本作出分析,借助加工器的动态能力将所储存的知识动态地提取出来,并运用于知识表征,
然后借助这些知识资源产生文本意义表征,并由特定输出设备完成在意义交流层次的人机对话。
2. 本体
本体是用来描述某个领域的知识的。描述了该领域内各个概念和概念间的关系。(使用本体是为了用它进行关于个体的推理)
3. 操作:与或非
4. 概念
人们通过对客观世界中存在的对象进行观察和思考,经过思维的抽象,在思想中产生了“概念”。
概念是思维的产物,用来反映思维对象特有属性或本质属性。概念属于思维领域,为了交流,人们使用语词表达概念。语词只是概念的语言形式,同一个概念可以用不同的语词表达,同一个语词在不同的语境中表达不同的概念。因此,概念、语词和对象的关系是:概念是认知主体的认知结果,属于思想层面。语词是认识主体创造的用于表达概念。对象是客观存在。认知主体用概念来指代对象,并用语词来指称对象。
二、OWL学习
1. OWL介绍
OWL(Ontology Web Language)是一种本体语言,是W3C(World Wide Web Consortium),OWL让描述各种概念成为可能,还提供了很多功能。
2. 三类OWL
(1)OWL-lite:从语法上来说,OWL-Lite是三个之中最简单的一个,当你的本体中类的层次结构很简单,并且只有简单的约束(constraint)时适合使用它来描述本体。例如,在需要把一个已存在的辞典(thesauri)移植到另一个差不多简单的概念层次时,OWL-Lite可以做得又快又好。
(2)OWL-DL:和OWL-Lite相比,OWL-DL的表达能力要丰富许多,它的基础是描述逻辑(Description Logics,即DL的由来)。描述逻辑是一阶逻辑(First Order Logic)的一个可判定的变种(译注:不一定准确,原文decidable fragment),因此可以用来进行自动推理,计算机从而可以知道本体中的分类层次,以及本体中的各种概念是否一致。
(3)OWL-full:OWL-Full是OWL的三种子语言中表达能力最强的一个,适合在那些需要非常强的表达能力,而不用太关心可判定性(decidability)或是计算完全性的场合下使用。不过也正是由于表达能力太强这个原因,用OWL-Full表示的本体是不能进行自动推理的。
3.OWL本体的组成
(1)个体(individual):个体代表领域中我们感兴趣的对象,OWL不使用唯一命名假设,即两个不同的名称可以对应一个个体(例如:“伊丽莎白女王”和“伊丽莎白温莎”是指同一个人)。在OWL中,必须明确表示个体之间是否相同,否则它们的关系是不明确的。
注:个体(individual)有时也被称作实例(Instance)。
(2)属性(Property):属性是个体之间的二元关系。在描述逻辑中,它们就是角色(Role)的概念。
函数属性(Functional Property)——通过这个属性只能连接一个个体。hasBirthMother
反函数属性(Inverse Functional Property)——即这个属性的反属性是函数属性,也就是对于一个给定的个体,只有最多一个个体能通过该属性连接那个个体。isBirthMotherOf
传递属性(Transitive Property)——hasAncestor
对称属性(Symmetric Property)——hasSibling,如果一个属性是对称的那么它就不能是函数属性。
还可以将属性分为:
对象属性(Object Property)——连接两个个体。
数据类型属性(Datatype Property)——连接个体和XML Schema数据类型值或rdf literal,该属性不能为传递的,对称的,反函数的。
标注属性
(Annotation
Property)——用来对类,属性,个体和本体添加信息(元数据)。OWL-DL对标注属性作出了如下限制:(1)标注属性的filler只能为,literal或URI或个体。(2)标注属性没有子属性,也不能为其它属性的子属性,而且不能使用domain和range。
(3)类(class):表示一些个体的集合,它使用数学的方法描述出该类中成员必须具有的条件。
注:概念(concept)这个词有时被用来代替类,实际上,类是概念的一个具体表现。
4.OWL中本体的结构
(1)命名空间
在使用一组术语之前,需要精确地指出哪些具体的词汇表将会用到。一个典型的OWL本体以命名空间声明开始,这些命名空间写到
属性值是不具有命名空间的,在OWL里可以写出它们的完整URI。完整的URI中可以利用实体定义来简略。
如:
]>
在声明这些实体后,我们可以将“&vin;merlot”作为“http://www.w3.org/TR/2004/REC -owl-guide-20040210/wine#merlot”的简写。
(2)本体头部
在owl:Ontology标签中给出本体的声明。这些标签支持一些重要的常务工作比如注释、版本控制以及其他本体的嵌入等。
owl:Ontology元素是用来收集关于当前文档的OWL元数据的。
rdf:about属性为本体提供一个名称或引用。
rdfs:comment提供了显然必须的为本体添加注解的能力。
owl:priorVersion是一个为用于本体的版本控制系统提供相关信息(hook)的标准标签。本体的版本控制将在后面作进一步讨论。
owl:imports提供了一种嵌入机制。owl:imports接受一个用rdf:resource属性标识的参数。
(3)数据集成与隐私
不同的个体成员可能表示同一个体,owl:sameAs表达等价的能力。
5. 基本元素
5.1简单的个体和类
外延:我们称由属于某个类的个体所构成的集合为该类的外延(extension)。
本体:为了进行相关个体的推理。
5.1.1 简单的具名类
一个领域中最基本的概念对应各个分类层次树的根。
。。。。国际化资源标识符(IRI)。。。。。统一资源标识符(URI)。。。。
rdf:ID="Region" 被用于引入一个名称(作为定义的一部分)
在这一文档中,我们现在可以用#Region来引用Region类,例如 rdf:resource="#Region"
rdfs:subClassOf是用于类的基本分类构造符,次关系是可传递的
一个类的定义由两部分组成:引入或引用一个名称,以及一个限制表。
5.1.2 个体
/*表示个体,type是一个rdf属性,用于关联一个个体和它所属的类*/
或者使用
语句来表示个体
** Web本体被设计成为分布式的,我们可以通过导入和补充已有的本体来创建衍生的本体。
5.1.3 使用方面的考虑
一个类仅是一个名称和一些描述某集合内个体的属性;而个体是该集合的成员。因此,类应自然地对应于与某论域中的事物的出现集合,而个体应对应于可被归入这些类的实际的实体。
子类:类的子集合
实例:表示一个单一的个体
一个本体的开发应坚定地由它的预定用途所驱动。这些问题也存在于OWL Full和OWL DL之间的一个重要区别。OWL Full允许将类(class)用作实例(instance),而OWL DL不允许。
5.2 简单属性
一个属性是一个二元关系,有两种类型的属性
数据类型属性(datatype properties):类实例与RDF文字或XML Schema数据类型间的关系。
对象属性(object properties):两个类的实例间的关系。
5.2.1 定义属性
/*表示定义域*/
/*表示值域*/
在OWL中,一个值域可被用来推断一个类型
可以推断出,LindemansBin65Chardonnay为一种葡萄酒,因为其定义域为wine
可以定义子属性,属性是传递的,例如X为Y的子属性,如果具有属性X,则必然同时具有属性Y。
5.2.2 属性和数据类型
数据类型属性:将个体关联到数据(值域为:RDF文字或XML Schema数据类型)
yearValue属性将VintageYears与一个整数值相关联。
5.2.3 个体的属性
5.3属性特性
5.3.1 传递属性:P(x,y),P(y,z) P(x,z)
5.3.2 对称属性:p(x,y)当且仅当P(y, x)【注意是同一个关系】
5.3.3 函数属性:P(x,y) 与P(x,z) 蕴含 y = z,即对应值的唯一性
5.3.4 逆属性(inverseOf):P1(x,y) 当且仅当P2(y,x)【注意是不同关系】
5.3.5反函数属性(InverseFunctional):P(y,x) 与 P(z,x) 蕴含 y = z;
InverseFunctional意味着属性的值域中的元素为定义域中的每个元素提供了一个唯一的标识。
5.4 属性限制
5.4.1 两个属性限制机制,allValuesFrom与 someValuesFrom是局部的(local),它们仅仅在包含它们的类的定义中起作用。
owl:allValuesFrom属性限制要求:对于每一个有指定属性实例的类实例,该属性的值必须是由owl:allValuesFrom从句指定的类的成员。
Wine的制造商必须是Winery。allValuesFrom限制仅仅应用在Wine的hasMaker 属性上。Cheese的制造商并不受这一局部限制的约束。(代码如下)
owl:someValuesFrom限制与之相似。
关系含意
allValuesFrom对于所有的葡萄酒,如果它们有制造商,那么所有的制造商都是酿酒厂。
someValuesFrom对于所有的葡萄酒,它们中至少有一个的制造商是酿酒厂。
前者并不要求一种葡萄酒一定要有一个制造商。如果它确实有一个或多个制造商,那么这些制造商必须全部都是酿酒厂。后者要求至少有一个制造商是酿酒厂,但是可以存在不是酿酒厂的制造商。
5.4.2 基数限制
owl:cardinality:这一约束允许对一个关系中的元素数目作出精确的限制。
例如,我们可以将Vintage标识为恰好含有一个VintageYear的类。
值域限制在0和1的基数表达式(Cardinality
expressions)是OWL Lite的一部分。这使得用户能够表示“至少一个”,“不超过一个”,和“恰好一个”这几种意思。OWL
DL中还允许使用除0与1以外的正整数值。owl:maxCardinality能够用来指定一个上界。owl:minCardinality能够用来指定一个下界。使用二者的组合就能够将一个属性的基数限制为一个数值区间。
5.4.3 hasValue
hasValue 使得我们能够根据“特定的”属性值的存在来标识类。因此,一个个体只要至少有“一个”属性值等于hasValue的资源,这一个体就是该类的成员。
如果是Burgundy酒,那就都是干(dry)的酒。也即,它们的hasSugar属性必须至少有一个是值等于Dry(干的)。
【我的理解是,每个Burgundy都要有一个干的(Dry)属性,以此来标识该酒是干酒】
6. 本体映射
用于实现本体的共享。
6.1 类和属性之间的等价关系(equivalentClass,equivalentProperty)
属性owl:equivalentClass被用来表示两个类有着完全相同的实例。但我们要注意,在OWL DL中,类仅仅代表着个体的集合而不是个体本身。然而在OWL FULL中,我们能够使用owl:sameAs来表示两个类在各方面均完全一致。
关系蕴涵
subClassOfTexasThings(x) implies locatedIn(x,y) and TexasRegion(y)
equivalentClassTexasThings(x) implies locatedIn(x,y) and TexasRegion(y)
类似的,我们可以通过使用owl:equivalentProperty属性声明表达属性的等同。
6.2 个体间的同一性
SameAs:描述个体之间相同的机制与描述类之间的相同机制类似,仅仅只要两个个体的声明形成一致的就可以了。
假如hasMaker是一个函数型属性,那么下面的例子就不一定会产生冲突。
除非和我们本体中的其他信息发生冲突,不然的话这样的描述是没有冲突的,他说明Bancroft和Beringer是相同的个体。
要清楚,修饰(或引用)两个类用sameAs还是用equivalentClass效果是不同的。用sameAs的时候,把一个类解释为一个个体,就像在OWL
Full中一样,这有利于对本体进行分类。在OWL
Full中,sameAs可以用来引用两个东西,如一个类和一个个体、一个类和一个属性等等,无论什么情况,都将被解释为个体。
6.3 不同的个体(DifferentFrom,AllDifferent)
这一机制提供了与sameAs相反的效果。
说明了三个值互不相同。如果我们没有用 differentFrom元素来申明既干又甜的葡萄酒,这意味着“干葡萄酒”和“甜葡萄酒”是相同的。但是我们从上面申明的元素来推断,这又是矛盾的。还有一种更便利的定义相互不同个体的机制,如下
要注意,owl:distinctMembers属性声明只能和owl:AllDifferent属性声明一起结合使用。
7. 复杂类
用于创建类的表达式。OWL支持基本的集合操作,即并,交和补运算。它们分别被命名为owl:unionOf,owl:intersectionOf,和owl:complementOf.此外,类还可以是枚举的。类的外延可以使用oneOf构造子来显示的声明。同时,我们也可以声明类的外延必须是互不相交的。
注意:OWL类外延是由个体组成的集合,二这些个体都是类的成员。
7.1 集合运算符
7.1.1 交运算
/*这是必须的,因为必须对集合操作*/
【这个例子表示,白葡萄酒就是葡萄酒和白色物体的相交的集合。如果不这么表示,计算机只知道,白葡萄酒有白色的属性;却不知道,所有白色的葡萄酒是白葡萄酒】
最后,WhiteBurgundy类恰好是白葡萄酒和Burgundies的交集。依次,Burgundies生产在法国一个叫做Bourgogne的地方并且它是干葡萄酒(dry
wine)。因此,所有满足这些标准的葡萄酒个体都是WhiteBurgundy类的外延的一部分。
7.1.2 并运算
表示两个集合的∪。
使用方法同上图,将intersectionOf改成unionOf
7.1.3 补运算
就是表示差集,complementOf典型的用法是与其它集合运算符联合使用,如下
【上面的例子定义了一个NonFrenchWine类,它是Wine类与所有不位于法国的事物的集合的交集。】
7.2 枚举类 one of
以直接枚举的方式描述类的成员。特别的,这个定义完整的描述了类的外延(类的范围?),因此任何其他个体都不能声明为属于这个类。如下:
【这段代码说明,WineColor只包含三种,white rose和red,任何其他的颜色都不是winecolor类的实例】
oneOf结构的每一个元素都必须是一个有效声明的个体。一个个体必须属于某个类。在上面的例子中,每一个个体都是通过名字来引用的。我们使用owl:Thing简单地进行引用,尽管这有点多余(因为每个个体都属于owl:Thing)。另外,我们也可以根据具体类型WineColor来引用集合中的元素:
另外,较复杂的个体描述同样也可以是oneOf结构的有效元素,例如:
7.3 不相交类disjointWith
使用owl:disjointWith构造子可以表达一组类是不相交的。它保证了属于某一个类的个体不能同时又是另一个指定类的实例。
Pasta例子声明了多个不相交类。注意它只声明了Pasta与其它所有类是不相交的。例如,它并没有保证Meat和Fruit是不相交的。为了声明一组类是互不相交的,我们必须对每两个类都使用owl:disjointWith来声明。
在下面的例子中,我们定义了Fruit是SweetFruit和NonSweetFruit的并集。而且我们知道这些子类恰好将Fruit划分成了连个截然不同的子类,因为它们是互不相交的。随着互不相交的类的增加,不相交的声明的数目也会相应的增加到n的2次方。然而,在我们已知的用例中,n通常比较小。
8. 本体版本的控制
本体和软件一样需要维护,因此它们将随着时间的推移而改变。在一个owl:Ontology元素(如上面讨论的http://www.w3.org/TR/2004/REC-owl-guide-20040210/#OntologyHeaders)
内,链接到一个以前定义的本体版本是可能的。属性owl:priorVersion被用来提供这种链接,并能用它跟踪一个本体的版本历史。
本体版本可能彼此互不兼容,例如,一个本体以前的版本可能包含与现在版本中的陈述相矛盾的陈述。在一个owl:Ontology元素中,我们使用owl:backwardCompatibleWith和owl:incompatibleWith这些属性来指出本体版本是兼容还是不兼容以前的版本。如果没有进行owl:backwardCompatibleWith声明,那么我们假定就不存在兼容性。除了上面讲到的两个属性,还有一个属性owl:versionInfo适用与版本控制系统,它提供了一些相关信息(hook)。和前面三个属性相反的是,owl:versionInfo的客体是一个文字值(literal),这一属性除了可以用来注释本体之外还可以用来注释类和属性。