spacy是一个python的自然语言处理的包,可以做词性分析、命名实体识别、依赖关系刻画,embedding的计算以及可视化。
- 直接清华源安装spacy
pip install spacy
- 点击下载.whl文件到本地,这里是下载地址
- 安装下载的whl
pip install zh_core_web_sm-3.8.0-py3-none-any.whl
- 测试效果
import spacy
# 处理文本
nlp = spacy.load('zh_core_web_sm')
doc = nlp("北大和清华大学都是国内顶好的学校")
# 查看实体
for ent in doc.ents:
# 打印实体和类型
print(ent.text, ent.label_)
北大 ORG
清华大学 ORG
更多nlp相关处理包,见多语言-分词工具