python自然语言处理学习
新人入坑前需要理清的学习思路为:
- 首先是弄懂什么是自然语言
- 然后是自然语言处理用于哪些方面
- 最后是如何使用自然语言处理对应的工程项目
如果你不会使用python也没有关系,你可以先学习一下python的基本语法及使用然后再来看这篇文章,学习地址在->Python3 教程|菜鸟教程
确定好以上这几个目标才能更好的学习自然语言
接下来第一件事是安装nltk,nltk是什么?nltk全称natural language toolkit,在python中使用的nltk是自然语言工具库,其封装了大多数自然语言处理的解决方案。
nltk 安装方法
如果在pip install 或pip3 install 对应库时出现Could not find a version that satisfies the requirement ******** (from versions: )时为表示当前未找到该库的下载地址,多试几遍或切换pip的下载地址即可
在安装nltk库后需要安装numpy库,numpy库是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。numpy库使用方案可在NumPy教程|菜鸟教程中学到
安装完nltk 与 numpy时在python脚本中编辑
import nltk
import numpy
时确认是否安装成功即可
在确认安装完成之后,为方便学习nltk,编写以下代码并运行,进一步加载在学习nltk时所需要用到的基础数据
# -*- coding: utf-8 -*-
import nltk
if __name__ == '__main__':
nltk.download('book')
选择book选项双击进行下载,等待数据加载完毕即可。
如果出现无法下载情况,则进入https://github.com/nltk/nltk_data 地址进行下载即可,里面的packages就是我们想要找到的nltk_data,将packages下载下来,改名为nltk_data,放入在运行 nltk.download('book')时打开的Download Directory目录即可
数据被下载完成,你就可以使用Python解释器加载其中一些资源。
例如
from nltk.book import *