缘由
从R语言转到python的过程中尝试过多种python环境,也遇到不少的坑,目前个人认为最方便的python环境管理工具:conda。不论是在win上还是在ubuntu上。win中独立安装python再pip各种包的时候scipy的安装会让人头疼不已。而anaconda已经把data science需要的各种包基本打包完成,虽然deep learning各种框架的没有集成在anaconda中,但是通过conda管理的各个env,可以让你随意pip/git/wheel折腾,我也不用担心把因为要安装CMAKE,BOOST,tensor,pytorch等而把之前的环境弄坏。
环境管理
- 查看已安装的环境
conda info -e
- 创建新的环境
conda create -n env_name python=3.5 #以python3.5为例
- 激活环境
activate env_name #win
source activate env_name #ubuntu
conda install anaconda #可选项 安装对应的anaconda版本中的所有包
- 退出当前环境
deactivate #win
source deactivate #ubuntu
- 查看已安装的包(conda)
conda list
conda list -n env_name
- 卸载包(conda)
conda remove pkg_name
- 或者对正在操作的环境不爽,直接删除环境重新配置环境
conda remove -n env_name --all
- 如果网络慢的受不了,可以添加清华大学的镜像
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
jupyter notebook
个人喜欢现在jupyter上写code,因为它的交互方式和Rstudio很像,比较容易定位错误。在jupyter上完成后再将代码优化移植到pycharm上试试。jupyter还有一个很方便的地方:即使不在命令行中激活某环境也可以使用那个环境的配置,而且目前它是我远程在服务器上进行data science工作的唯一手段,pycharm用的社区版,公司政策不能使用破解软件,并且没有购买专业版((lll¬ω¬))。如果是使用conda安装的python那么不需要再次安装jupyter否则jupyter需要独立安装一次。jupyter能支持多种语言code,jupyter版本所对应支持的语言版本参见。
- 查看jupyter已有的kernel
jupyter kernelspec list
- 安装jupyter kernel
(source) activate env_name
conda install ipykernel
python -m ipykernel install --user --name env_name --display-name "Python (env_name or anyname you like)"
完成后可以查看是否安装成功
当然jupyter上也可以安装R kernel,简单的方式:
conda install -c r r-essentials
不过个人习惯Rstudio就没在jupyter上安装R kernel.上述jupyter部分主要是在win上的的操作,linux上的如何run一个jupyter server参考jupyter server