本节介绍了scikit-learn相关开发环境的搭建步骤。这里主要用到IPython、Numpy、Pandas、Matplotlib和scikit-learn等软件包。
搭建Python开发环境一般有两种常用的方式:
(1)安装Anaconda集成环境
Anaconda是一个开源的Python发行版本,其包含了conda、python、ipython、numpy、scipy、pandas、matplotlib和scikit-learn等180多个常用的科学计算包及其依赖项。由于包含了大量的python包,Anaconda的下载文件比较大,如果只需要其中某些包,或者为了节省带宽或存储空间,也可以使用Miniconda这个较小的发行版(仅包含conda和 Python)。使用Anaconda可以很容易地将多套Python开发环境(如Python2和Python3)完全隔离开来,使用conda命令来切换需要的开发环境。
关于Anaconda的安装和使用,可以参考下面这两篇教程,感谢原创。
(2)单独安装需要的软件包
如果不想安装Anaconda环境,也可以直接使用pip命令单独安装需要的软件包:
# pip install jupyter numpy matplotlib scipy pandas scikit-learn seaborn
安装完成后,可以在终端输入ipython命令启动IPython,并检查每个工具包的版本号:
]# ipython
Python 3.7.1 (default, Dec 14 2018, 19:28:38)
Type 'copyright', 'credits' or 'license' for more information
IPython 7.2.0 -- An enhanced Interactive Python. Type '?' for help.
In [1]: import numpy
In [2]: import scipy
In [3]: import pandas
In [4]: import matplotlib
In [5]: import sklearn
In [6]: numpy.__version__
Out[6]: '1.15.4'
In [7]: scipy.__version__
Out[7]: '1.1.0'
In [8]: pandas.__version__
Out[8]: '0.23.4'
In [9]: matplotlib.__version__
Out[9]: '3.0.2'
In [10]: sklearn.__version__
Out[10]: '0.20.1'