欢迎关注哈希大数据微信公众号【哈希大数据】
前面为大家介绍了机器学习入门要学的基础知识、算法和概念。但我想撸机器学习的代码该怎么办?初来乍到不知道怎么配机器学习的环境呀!莫慌莫慌,哈希本次为大家讲讲 Windows环境中如何搭建Python机器学习环境。
为啥只讲Windows环境?你都用linux了,还搞不定这个环境呀?别哭别哭搞不定也很正常,linux毕竟自带的Python是2.7版本,咱们想用3.5版本的还要自己装,里面又涉及到多版本共存问题,咦想想还挺麻烦所以下次再讲吧!
当然Mac的下次也会讲哦!
如果只是想了解一下机器学习,抱着试试看的态度,咱们还是不要装了。。。
这里首推Anaconda+pycharm组合,也可以Anaconda+Jupyter notebook。Anaconda安装好后它带了一个编译器Spyder,如果不做大的项目只是平时跑跑Python用它也挺好,不过今天咱们就不讲它了。
那么为啥要用anaconda呢?
1.Anaconda附带了一大批常用数据科学包如scipy、numpy等,它附带了conda、Python 和150多个科学包及其依赖项。因此可以免去你大量与安装某些科学数据包作斗争的时间,直接上手进行数据分析处理。
2.Anaconda 是在 conda(一个包管理器和环境管理器)上发展出来的。在数据分析中,你会用到很多第三方的包,而conda(包管理器)可以很好的帮助你在计算机上安装和管理这些包,包括安装、卸载和更新包。
3.管理环境
什么是环境?为什么需要管理环境?
python是一种脚本语言,他的开发环境是用来编译运行python源程序的。
对Python开发来说不同的项目可能需要不同的Python版本、第三方库版本,Python2和Python3是不兼容的,比如你在A项目中用了Python2,而新的项目B老大要求使用Python3,而同时安装两个Python版本可能会造成许多混乱和错误。这时候 conda就可以帮助你为不同的项目建立不同的运行环境。
如何安装anaconda?
下载网址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
这里提供给大家的是清华大学开源软件镜像网站,因为从anaconda的官网下载东西非常慢,这里要注意自己的电脑是32位还是64位不要装错了。
下载完成后便开始安装,如果计算机上已经安装了Python,安装不会对你有任何影响。实际上,脚本和程序使用的默认Python是Anaconda附带的Python。
注意:如果你是windows 10系统,注意在安装Anaconda软件的时候,右击安装软件→选择以管理员的身份运行,如下图。
安装时可以安装到非C盘中,其他全程默认,需要注意的是下面这步两个都选上:
一方面不用自己再去配置环境变量,另一反面Python的其他IDE也可以使用anaconda啦。
完成安装后,如果你是在windows7上操作,按下面图打开 Anaconda Prompt
Windows8如下图可以直接用快捷键win+Q搜索Anaconda Prompt:
点击Anaconda Prompt进入命令行窗口后输入:conda list
可以看到目前安装好的所有包如下图:
然后请输入:conda upgrade --all
对所有已安装的包进行更新,以防后面出现不必要的问题。
下面简单介绍利用conda进行安装、卸载和更新第三方包的操作:
安装:
conda install package_names
例如: conda install requests urllib
卸载:
conda remove package_names
更新:
conda updata package_names
安装好anaconda后咱们已经将Jupyter notebook成功安装了,此时在命令行中输入:Jupyter notebook 便可启动Jupyter notebook如下图:
点击Python3便可进入编辑页面:
Jupyter notebook的使用教程
notebook 界面从上而下由四个区域组成:notebook 的名称(点击即可修改)、提供保存、导出、重载 notebook以及重启内核等选项的工具栏、快捷键Toolbar、notebook 的内容编辑区。
下面概述菜单栏各项的主要功能:
File:
New Notebook打开新笔记
Checkpoint(记录点,类比不同版本)
Revert to Checkpoint返回到某一个记录点
Download as: ipynb、py、md、html、pdf
Edit:
包括复制、粘贴、删除、合并、移动等cell区域的操作
View:
Toggle Header是否显示头部信息,包括文件名和上次保存时间
Toggle ToolBar是否显示工具栏
Cell ToolBar
Insert:
Insert Cell Above上方插入一个cell区域
Insert Cell Below 下方插入一个cell区域
Kernel:
Restart和Reconnect相关
Change Kernel:
换Python环境
Help:一些教程链接
快捷键Toolbar集成了高频使用的功能,其中点击显示为“code”的单元格类型右侧下拉菜单可改变cell单元格的类型,点击键盘可查看所有快捷键。
整个jupyter notebook界面最为重要的就是cell区域,cell中有多种类型,包括表示代码的code单元格与格式化文本的Markdown单元格,均可运行(快捷键为shift+enter,更多快捷键见参考链接最后一条),code类型结果为程序结果,Markdown类型结果则为格式化的文本,包括正文、标题等。
介绍今天的第二主角Pycharm
Pycharm的安装
下载网址:https://www.jetbrains.com/pycharm/download/#section=windows
下载完成后,直接安装就OK,可以装在非系统盘里面,其他所有都默认就OK。
安装完成后来创建一个咱们自己的第一个程序:
1、单击桌面上的pycharm图标,进入到pycharm中,如下图所示:
2、我们选择第二个,然后点击Ok:
3、点击上图中的Accept进入下一步:
4、点击上图中的ok进入下一步:
5、点击Create New Project,进入如下图的界面,图中的Location是选择你安装的python的位置,选择好后,点击create。
6、在进入的界面如下图,鼠标右击图中箭头指向的地方,然后最后选择python file,在弹出的框中填写文件名(任意填写)。
7、文件创建成功后便进入如下的界面,便可以编写自己的程序了,当然下图是我自己设置的背景,这里我就不详细说明了(自行百度即可)。
参考链接:
https://www.zhihu.com/question/58033789
Jupyter Notebook简洁教程:
https://blog.csdn.net/u013023297/article/details/71082881
Pycharm及python安装详细教程:
https://blog.csdn.net/qq_29883591/article/details/52664478