1.这是官网
2.点进去看一下(nltk)
看这个还是比较简单的就是pip么,但是你安装了pip之后还不行,还要安装NLTK data
3.点进去看一下(nltk data)
4.上文中所说的new window长下面这个样子,但是如果你选择这样安装,那就废了,很慢,很容易卡主,也很容易出错退出,慢到无敌。
如果说慢都是小事,那么还有一个事是大事了,当我们在服务器操作的时候完全没有界面怎么操作???
5.命令行安装nltk data
使用命令
python -m nltk.downloader all
就下载到默认的文件夹C:\nltk_data (Windows); /usr/local/share/nltk_data (Mac); and /usr/share/nltk_data (Unix)
如果你想自己指定文件夹,也可以使用命令
sudo python -m nltk.downloader -d /usr/local/share/nltk_data all
6.你也可以自己下载压缩包然后解压
我感觉比较推荐这样的做法,比较快,比较可靠,你可以在网上随便搜一搜,很多压缩包的资源,下面是我的压缩包,给出我自己的网盘地址,但是因为这个跟时效性有关系,比如有些包更新了,但是你下载的压缩包比较老的话,会提示你这个包没有安装的。所以你还是从官网下载最新的吧。(现在是2019年9月24日。)
链接:https://pan.baidu.com/s/1VQbigIlWit96wg8KJw9Tkg
提取码:tm4o
这个网址有比较详细的做法
https://www.cnblogs.com/34fj/p/9993842.html
4,5比较重要,如果不添加路径就找不到了。
我选择的就是这种方法,因为我在服务器上,没有界面,用命令行很慢,也老是报错。所以我提前下载好了nltk_data.zip的压缩包。
首先
我先把本地下载的压缩包,先上传到服务器
其次
我们服务器上包了一层docker,要从服务器传到docker容器里面
将主机./RS-MapReduce目录拷贝到容器30026605dcfe的/home/cloudera目录下。
docker cp RS-MapReduce 30026605dcfe:/home/cloudera
将容器30026605dcfe的/home/cloudera/RS-MapReduce目录拷贝到主机的/tmp目录中。
docker cp 30026605dcfe:/home/cloudera/RS-MapReduce /tmp/