wordnet介绍

wordnet是以同义词集合(synset)作为基本建构单位进行组织的,即每个同义词集是网络里的一个结点,每个同义词集合都代表一个基本的语义概念并且这些集合之前由各种关系连接。

词语类型

共包含4种类型的词汇,名词,动词,形容词和副词,各自被组织成一个同义词的网络。

关系类型(详可见参考文献5)

上下位关系(动词、名词)、蕴含关系(动词)、相似关系(名词)、成员部分关系(名词)、物质部分关系(名词)、部件部分关系(名词)、致使关系(动词)、相关动词关系(动词)、反义关系(形容词)、近义关系(形容词)、关系性形容词(形容词)、相关关系(形容词)、属性关系(形容词)、反义关系
(副词)、衍生关系(副词)
注:
名词有一棵上下位词关系树,根节点为entity,动词有559棵上下位词关系树。
属性关系(形容词):如heavy是weight(名词)的属性
衍生关系(副词):大部分副词都从形容词衍生得到,如happily衍生于happy
wordnet官网的relation部分介绍了wordnet中的主要关系

python wordnet

python的nltk包提供了读wordnet的接口


下载nltk wordnet数据后的地址

参考资料

  1. wordnet官网https://wordnet.princeton.edu/
  2. python wordnet使用方法https://blog.csdn.net/King_John/article/details/80252594
  3. 知乎的一篇介绍https://zhuanlan.zhihu.com/p/26461511
  4. nltk wordnet文档http://www.nltk.org/howto/wordnet.html
  5. wordnet关系https://wenku.baidu.com/view/18c6c532b90d6c85ec3ac6de.html#
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 介绍 WordNet是包含语义信息的英语词典。 wordnet根据单词的语义分组,相同语义的单词组合在一起称为sy...
    ltochange阅读 3,838评论 0 0
  • 概述 nltk是一个自然语言处理工具包,在NLP领域中,最常使用的一个Python库。https://yiyibo...
    HyRer阅读 4,396评论 0 1
  • 基本概念 1. 语料库 语料库(corpus)就是存放语言材料的仓库(语言数据库)。 基于语料库进行语言学研究-语...
    SpareNoEfforts阅读 8,438评论 0 12
  • 自然语言处理教程 原文:Natural Language Process 译者:飞龙 协议:CC BY-NC-SA...
    布客飞龙阅读 33,026评论 6 68
  • 1. 说明  今天讨论的是自然语言中的知识抽取和知识表示,换言之,就是如何从大量的书籍文献中剥离出我们关心的...
    xieyan0811阅读 4,394评论 0 0