最近做命名实体识别(NER)的任务比较多,也刚刚接触NER不久,做一下小小的总结。近两年中文命名实体识别在信息抽取和关系抽取上的应用受到了研究人员的广泛关注,很多比赛也以NE...
最近做命名实体识别(NER)的任务比较多,也刚刚接触NER不久,做一下小小的总结。近两年中文命名实体识别在信息抽取和关系抽取上的应用受到了研究人员的广泛关注,很多比赛也以NE...
在之前的文章《利用Word2vec生成句向量(一)》中,介绍了两种句向量的生成方法,本文将介绍一种号称"简单却具有一定竞争力"的句向量表示方法:SIF加权平均论文见A sim...
构建上市公司知识图谱 由于我的数据都存储在mysql中,格式较为友好,避免了复杂的知识抽取的过程.首先,类似于数据库的ER图设计,设计出各个表之间对应的关系,构建出符合知识图...
Bert开源了预训练的中文模型,如果你想直接使用Bert模型生成句子向量(当做一个黑盒),并用于深度学习模型中,本文将给出一个作者亲自实践的实例.本文内容只针对于实践,并不会...
Neo4J在Ubuntu下的安装比较简单,不在此赘述,具体请参考: https://blog.csdn.net/qq_27009517/article/details/800...
之前介绍了利用LOAD CSV语句导入导入Neo4J的方法,但是这种方法对于百万级的数据是无能为力的。我亲自实践了在python中利用py2neo和LOAD CSV语句导入百...
在词向量的选择方面,好像大部分研究人员用比较流行的Word2vec比较多,而忽略了GloVe这一个强力的词向量,网上相关资料也比较少。有兴趣研究其相关理论的同学可以自己查阅相...
jieba分词是利用python进行自然语言处理中必不可少的常用工具,添加自定义词典也是jieba分词中的的常用功能。 然而每次运行程序,jieba自定义词典都需要重新加载,...
首先为什么是Word2vec?不是Glove也不是什么Fasttext等其他的词向量?Glove词向量的训练与部署可以看我之前的文章:https://www.jianshu....