Python深度学习生态的演变非常迅猛,一些强大的框架随着深度学习领域的发展逐渐被大量的人使用而流行起来。本文对一些常见的深度学习框架进行介绍,对它们的特点进行对比。
Tensorflow
Tensorflow是Google开源的深度学习框架,有着非常广泛的应用。使用C++语言开发,使用数据流图DAG的形式进行计算。图中的节点代表数学计算。
TensorFlow命令式的编程语言,是静态的。首先必须构建一个神经网络结构,然后一次又一次地使用同样的结构。如果想要改变网络结构,就必须从头开始。
其灵活的架构可以部署在一个或多个CPU\GPU服务器中,或使用单一的API应用在移动设备中。有Python和C++的接口。
由于其语言比较底层,有很多基于tensorflow的第三方库将Tensorflow的函数进行了封装。如:Keras,TFlearn,TensorFlow-slim,TensorLayer,Estimator。
其中TensorFlow-slim是Google官方给出的高层封装库。包含在TensorFlow的库中。
TFflearn是相比TF-slim更简洁的高层封装。没有集成在TensorFlow的包中,需要单独安装。其不仅对神经网络结构定义进行了封装,还对模型训练的过程进行了封装。Keras
Keras底层可以支持TensorFlow、MXNet、Theano。和TFLearn API类似,也对模型定义、损失函数、训练过程进行了封装。整个训练过程可分为数据处理、模型定义和模型训练三个部分。可以快速地搭建深度网络,灵活地选取训练参数来进行网路训练。Keras已被直接引入到TensorFlow的核心代码库,成为官方提供的高层封装之一。
Keras API训练模型可以线定义一个Sequential类,在Sequential实例中,通过add函数添加网络层。通过compile函数 指定 优化函数、损失函数、训练过程中的监控指标。之后,Sequential实例可以通过fit函数来训练模型。Caffe
Caffe全称为Convolutional Architecture for Fast Feature Embedding,是一个清晰而高
效的开惊深度学习框架,由伯克利视觉学中心进行维护。
和TensorFlow一样用C++编写,早期只提供C++接口,随着后来的发展才提供了python的接口。
Caffe对CNN的支持非常好,很多ImageNet比赛里面使用的网络都是用Caffe写的,这也是Caffe得以流行的原因。它的缺点是不够灵活,并且内存占用高。
- Theano
Theano在2008年诞生于蒙特利尔理工学院,其派生了大量深度学习python工具,包括blocks keras。
Theano的核心是一个数学表达式的编译器,它知道如何获取你的结构。并使之成为一个 使用 numpy,本地库的高效代码。它是为深度学习中处理大型神经网络算法所需的计算而专门设计的,是这类库的首选之一。
- Torch和Pytorch
Facebook开源了大量Torch的深度学习模块和扩展。还被Twitter、CMU(卡耐基梅隆大学)、Salesforce等机构采用。特点是特别灵活,采用Lua开发。
它是PyTorch的前身,PyTorch底层和Torch框架一样,但使用Python重新写了很多内容,提供Python接口。
PyTorch通过一种反向自动求导的技术,可以容许零延迟地任意改变神经网络的行为。与TensorFlow不同,是一种动态的神经网络。
- MXNet
MXNet是亚马逊官方框架,有着非常好的分布式支持,性能特别好,占用显存低。
开放的接口丰富,有Python、C++、R、Matlab、Scala、JavaScript。
缺点是教程不够完善,社区不大。
- Scikit-Learn
Scikit-Learn也是非常流行的机器学习库之一。它拥有大量的数据挖掘和数据分析功能,使其成为研究人员和开发者的首选库。其内置了流行的NumPy、SciPy,matplotlib库,因此对许多已经使用这些库的人来说就有一种熟悉的感觉。