概念从属理论
概念从属理论(Conceptual Dependency, CD)是1973年由美国人工智能专家Schank提出的。他认为人脑中存在着某种概念基础,语言理解的过程就是把语句映射到概念基础之中去的过程。概念基础具有完善的结构,人往往能根据初始的输入预期可能的后续信息。因此,必须研究概念的结构和映射规则。
概念从属理论是一种描述句义和语义的方法。它是以词的概念为基的理解系统,词汇只是概念的符号,从整体而言,系统里没有词,只有概念。所有概念都可以由少量作用于物体的原语动作来描述,这是概念从属理论的基本思想。概念从属理论是一种表达自然语言句子意义的理论,对语义元素作了深层次的抽象,把它们归约成了若干个语义基元。语义基元是意义的最小单位,因而是不可再分割的。
概念从属理论本身就是一种不依赖于语言和语法的理论,汉语的语言理解同样可以应用概念从属理论,毕竟语言本身所表达的概念的含义是相同的,并不取决于语种的区别。
概念从属的表达
一个句子概念从属的表达,并非建立在与句中单词相对应的原语之上,而是建立在概念原语之上,这些概念原语合并起来,就构成了单词在任一特定语言中的意义。语义网仅提供一种结构,它以任意级别表达的信息都可放在这个结构里。概念从属同时提供了用于表达特殊信息块的一种结构和一组特殊原语。凡意义相同的词或句子,都可由相同的语义基元以及表示语义关系的有向弧来表示。
eg:
小王吃糖。
糖被小王吃了。
这两个句子的概念从属表达式都是“小王<---摄取<---糖”。其中箭头表示从属方向,“小王、糖”是概念结点。
语义基元
概念从属表达式可由数目有限的若干个语义基元组成,这些语义基元可以分为基本行为和基本状态两种。
基本行为
基本状态
概念从属理论中的基本状态数目较多,这里仅举出几种:
HEALTH( ±n):表示健康状态。
MENTAL STATE( ±n):表示精神状态。
PHYSICAL STATE( ±n):表示物理状态。
括号中的 (±n)表示基本状态的程度,程度高的用+n,程度低的用-n,高低的程度可用 n的大小来表示。例如:
Mary HEALTH(-10):表示 Mary is dead.(玛丽死了。)
John MENTAL STATE(+10):表示John is ecstatic.(约翰入迷了。)
Vase PHYSICAL STATE(-10):表示The vase is broken. (瓶子打碎了。)
基本状态和基本行为结合
例如 ,Johntold Mary that Bill was happy(约翰告诉玛丽说,比尔是幸福的)这个句子,可以不用上面那种带箭头的表达式,而用基本状态和基本行为表示如下:
John MTRANS(Bill BE MENTAL—STATE(+5))to Mary.
其中,MTRANS表示John把某种精神信息转移给Mary,也就是“约翰告诉玛丽”,MENTAL— STATE(+5)表示精神状态还好,即指“比尔是幸福的”,这是精神信息转移的内容。
行为和状态之间存在着一定的因果关系。CD理论中提出了如下5条因果规则:
行为可以引起状态的改变;
状态可以使行为成为可能;
状态可以使行为成为不可能;
状态和行为都可以激发一个精神事件;
精神事件可以成为行为的原因。
③在句子的意义表达式中,必须把隐晦地存在于句子中的信息尽量地显现出来。
例如, John eats the ice cream with a spoon.(约翰用勺吃冰淇淋。)这个句子可以用CD表达式如: 图中标有D的箭头表示方向从属关系,标有I的箭头表示工具从属关系。mouth(嘴)在原来的句子中并不存在,但它却作为一个概念结点进入了CD表达式中,因为根据CD理论的第三条原理,约翰的嘴是作为冰淇淋的接纳器隐晦地存在于句子的意义之中的,不管它是不是在句子中用文字或词语表示过,因此,应该把它在CD表达式中表示出来。
优缺点
- 确定概念间的从属关系其实就是一个抽象过程,它能透过事物的表象直达事物的本质。从抽象化的角度来处理概念,将使问题得到简化。
- 便于知识推理
- 可表达概念间的深层知识
概念从属树
西安电子科技大学 吴中兴 赵克
将特定知识域利用从属关系进行抽象处理,使其形成具 有不同抽象层次的知识结点形成的树状层次结构,其中父结点与其子结点之间存在明确的分类方法,我们把这种加入从属关系的树模型,称为概念从属树。
从属关系是一个概念的外延包含另一个概念的全部外延。 其中外延较大的概念叫抽象概念或属概念,外延较小的概念则称为具体概念或种概念。抽象概念包含了问题的主要方面,在一个抽象概念与具体概念之间还存在多个相对抽象的概念。
在概念从属树的结构中,每一个逻辑节点代表一个基本概念,节点的子节点是这个概念的进一步细化,也就是说,根节点是最抽象的逻辑节点,叶子节点是最细化最具体的逻辑节点,整个概念从属树从形状上来看是一棵多叉树的结构。
也有人将分类方法添加到树模型中,作为树模型的“权值”
概念从属树的优点
利用知识的继承性简化了知识库,增强了知识库的灵活性
扩充了知识的容量,细化了知识结构
结点间分类方法的添加,增加了知识的容量,避免了因知识容量增加而导致知识库的混淆,同时也细化了知识结构。知识的层次组织结构更加清晰,组织管理更加方便。
用知识之间的从属联系来组织、管理知识,更形象直观,比较符合人们的习惯。
概念从属树的缺点
概念从属树划分方法的添加,增加了知识的容量,同时容量的增加导致同一知识结点可能在树中多次出现(如图1中 的等边三角形结点),由此产生了知识冗余。对于同一知识域,抽象化的不同使得同一知识域的概念从属树呈现差异,因而其修改容易破坏知识的一致性。
参考文献
- 胡钢伟,产品设计领域基于概念内涵外延的名词与动词语义分析
- 张旭东,基于知识的用户偏好抽取及其在产品个性化推荐中的应用
- 吴中兴,赵克等,概念从属树——一种新的树模型设计
- 史慧,面向对象的汉语语义网络模型的研究