PARIS: Probabilistic Alignment of Relations, Instances, and Schema

1. 动机

由于不同的本体可能会用不同的词语描述相同的实体,并且这些本体的信息可以相互补充和完善,因此将这些本体对齐就显得非常重要。

2. 模型

实例等价

如果存在三元组 (x, r, y)(x, r, y'),并且r的置信度高,那么y=y'r置信度的计算思想是:对于(x, r, *),如果*的候选实例个数越少,r的置信度越高。

Subrelations

对于关系rr'rr'的subrelation的计算公式为:
P = \frac{同时满足关系r和r'的(x,y)总数}{满足关系r的(x,y)总数}
概率P越大,关系rr'的subrelation可能性越大。

Subclasses

对于classcc'cc'的subclass的计算公式为:
P = \frac{c和c'的共同实例数}{c的实例总数}

其中,实例等价依赖Subrelations的等价关系,Subrelations依赖等价实例,因此实例等价与Subrelations相互影响、相互促进。Subclasses依赖等价实例。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。