Stanford CoreNLP Python接口处理

Stanford CoreNLP的源代码是使用Java写的，提供了Server方式进行交互。stanfordcorenlp是一个对Stanford CoreNLP进行了封装的Python工具包，GitHub地址，使用非常方便。

安装stanfordcorenlp包之前：
1：下载安装JDK 1.8及以上版本。
2：下载Stanford CoreNLP文件，解压。
3：处理中文还需要下载中文的模型[jar文件]，然后放到stanford-corenlp-full根目录下即可（注意一定要下载这个文件哦，否则它默认是按英文来处理的）。

然后就是正常的流程

pip install stanford-corenlp

网上找了很多都是有点麻烦的配置，自己误打误撞弄出一个简单的分享一下，有问题可以留言讨论，

直接上代码：

import corenlp
client = corenlp.CoreNLPClient(annotators='tokenize ssplit pos'.split())
str = 'proved to be fake, made-up'
ann = client.annotate(str)
sentence = ann.sentence[0]
for token in sentence.token:
    print (token.word, token.pos)

接下来就会报错了，点进报错文档，锁定报错地点

文档时：client.py
地点：124行

锁定前三行

client.py

然后开始改代码

124行：我直接注释掉了

改后client.py

125行：将原来的{CORENLP_HOME}替换成你下载的Stanford CoreNLP文件，解压后的文件目录路径。

改后client.py

126行：将原来的os.getenv("CORENLP_HOME")替换成你下载的Stanford CoreNLP文件，解压后的文件目录下的stanford-corenlp-3.9.1.jar路径

改后client.py

然后再次运行前的代码，成功完成：

proved VBN
to TO
be VB
fake JJ
, ,
made-up JJ

希望可以帮助到你。
版权声明：本文为博主原创文章，未经博主允许不得转载。

最后编辑于：2018.08.24 10:56:40

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

Stanford CoreNLP Python接口处理

友情链接更多精彩内容