一、概述
在强化学习(Reinforcement Learning)的研究领域,并没有一些很好的模块可以使用。不像Deep Learning一样,有很多的框架,比如说tensorflow,pytorch,cafe等。应对这不同环境下的RL,可能编写的代码就会不一样,所以我们需要能够学会使用基础框架自己搭建一个属于自己的模型,更加好的理解底层原理,以后不管遇到什么样的环境,也能够应付。
- Numpy,pandas:用于数据处理;
- Matplotlib:展示误差曲线等,数据可视化;
- Tkinter:编写模拟环境;
- Tensorflow:实现神经网络和强化学习的结合;
- OpenAI gym:提供许多现成的游戏环境;
二、怎么搭建
(1)python
python可以在官网下载,下载安装好之后,可以将python加入到环境变量中,这样在命令行就可以方便运行python脚本;
python官网下载链接:https://www.python.org/downloads/
Anaconda官网下载链接:https://www.anaconda.com/
Python加入环境变量教程:https://www.jianshu.com/p/e75bb5d7f83a
(2)安装上述模块
在安装好了python之后。
查看python和tensorflow和pytorch相对应的版本,版本不对会报错的,关于cpu的版本和gpu版本安装是不一样的
easy_install.exe pip
pip install pip --upgrade
pip install numpy
pip install pandas
# 由于Tkinter 是内置到 python 的安装包中、只要安装好 Python 之后就能使用import导入Tkinter 库
# 对于TensorFlow 1.X,可以统一使用Tensorflow 1.15.0,对应的python版本为3.5-3.7。
pip install tensorflow==1.15.0 # CPU版本
pip install tensorflow_gpu==1.15.0 # GPU版本
# 对于TensorFlow 2.X,统一使用最新版本即可。
pip install tensorflow # tensorflow的CPU最新版本
pip install tensorflow_gpu # tensorflow的GPU最新版本
# torch 的安装看官网https://pytorch.org/get-started/locally/
pip3 install torch torchvision torchaudio
下面是python和tensorflow、pytorch 相对应的版本: