Stanford CoreNLP Python接口处理

Stanford CoreNLP的源代码是使用Java写的,提供了Server方式进行交互。stanfordcorenlp是一个对Stanford CoreNLP进行了封装的Python工具包,GitHub地址,使用非常方便。

安装stanfordcorenlp包之前:
1:下载安装JDK 1.8及以上版本。
2:下载Stanford CoreNLP文件,解压。
3:处理中文还需要下载中文的模型[jar文件],然后放到stanford-corenlp-full根目录下即可(注意一定要下载这个文件哦,否则它默认是按英文来处理的)。

然后就是正常的流程

pip install stanford-corenlp

网上找了很多都是有点麻烦的配置,自己误打误撞弄出一个简单的分享一下,有问题可以留言讨论,

直接上代码:

import corenlp
client = corenlp.CoreNLPClient(annotators='tokenize ssplit pos'.split())
str = 'proved to be fake, made-up'
ann = client.annotate(str)
sentence = ann.sentence[0]
for token in sentence.token:
    print (token.word, token.pos)

接下来就会报错了,点进报错文档,锁定报错地点

文档时:client.py
地点:124行

锁定前三行
client.py

然后开始改代码

124行:我直接注释掉了

改后client.py

125行:将原来的{CORENLP_HOME}替换成你下载的Stanford CoreNLP文件,解压后的文件目录路径。
改后client.py

126行:将原来的os.getenv("CORENLP_HOME")替换成你下载的Stanford CoreNLP文件,解压后的文件目录下的stanford-corenlp-3.9.1.jar路径
改后client.py

然后再次运行前的代码,成功完成:

proved VBN
to TO
be VB
fake JJ
, ,
made-up JJ

希望可以帮助到你。
版权声明:本文为博主原创文章,未经博主允许不得转载。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容