github 地址如下:https://github.com/facebookresearch/DrQA
Ps:(DrQA要求使用python3,因为作者使用的 virtualenv 就是python3,所以读者在使用python或者pip的时候可以用python3和pip3)
1.下载:git clone https://github.com/facebookresearch/DrQA.git
2.进入 DrQA文件夹,cd DrQA
3.安装依赖 pip install -r requirements.txt
4 安装DrQA python setup.py develop
说明:如果读者事先没有安装pytorch可以去官网查找安装方法
有以下两种方法比较方便
1: conda方式
conda install pytorch torchvision cuda80 -c soumith
2: pip方式
pip install http://download.pytorch.org/whl/cu80/torch-0.2.0.post3-cp35-cp35m-manylinux1_x86_64.whl
pip install torchvision
5.安装stanfordNLP库(建议使用vpn 不然太慢)
./install_corenlp.sh
它会帮我们下载 stanfordnlp 的 jar 包 并配置环境变量,环境变量配置在~/.bashrc
检验nlp 库是否安装好:
shell 检验:
1. 方式一:
vim test.py 输入以下内容:
from drqa.tokenizers import CoreNLP
Tokenizertok=CoreNLPTokenizer()
print (tok.tokenize('hello world').words() ) #Should complete immediately
保存,并执行python test.py
不报错就成功了。
如果报错了,可以执行以下执令
cat ~/.bashrc
将里面的内容 比如
export CLASSPATH=$CLASSPATH:/Users/yourpath/*
执行一遍
2.方式二:
vim test.py 输入以下内容:
from drqa.tokenizers import CoreNLP
Tokenizertok=CoreNLPTokenizer(classpath='/Users/yourpath/*')
print (tok.tokenize('hello world').words() ) #Should complete immediately
保存,并执行python test.py
其中classpath为下载的jar包的位置
6.下载模型(7.5G 最好也开vpn在aws上,速度非常慢,可能会断,可以多下几次)
./download.sh
7.执行demo
python scripts/pipeline/interactive.py
然后就可以输入想要问的问题了。
比如:
process('What is question answering?')
但是目前不是很支持中文。所以最好用英文。
然后会返回一个答案
answer:a computer science discipline within the fields of information retrieval and natural language processing