CNN章节的第一篇文章给大家分享一些神经网络的资料,作为深度学习的基础,神经网络的理论知识是必须学习的内容,神经网络分很多种,这里主要介绍目前在图像和语音识别领域大放异彩的卷积神经网络。我按照个人学习的先后次序列出了相关的博客和课程网站。下面话不多说,上货!
针对卷积网络,一个很好的例子是,数字手写识别模型,其识别数字的准确率达到了99.18%,已经普遍应用在银行的相关智能系统中, 下面这个网站是数字手写识别作者的博客,详细介绍了数字手写识别的实现细节和卷积神网络理论知识,并附有关键代码,里面的两篇论文十分重要。
https://link.zhihu.com/?target=http%3A//www.codeproject.com/Articles/16650/Neural-Network-for-Recognition-of-Handwritten-Digits
下面这个链接对于直观理解神经网络里面的过程很有帮助,当然如果你已经对于神经网络理论知识了解不少或者对于数字手写模型的介绍理解透彻,可以不看,内容较系统和基础。
https://link.zhihu.com/?target=http%3A//techeffigytutorials.blogspot.co.uk/2015/01/neural-network-illustrated-step-by-step.html
同时推荐去看看Andrew Ng的课程,在网易公开课等媒体上搜索机器学习课程,可以搜索到,主要介绍机器学习的重要的算法。不过另外一个好的选择是今年Li FeiFei&Andrej Karpathy的课程。Andrej Karpathy的博客非常值得关注,他对反向求导的解释十分有意思,可以看看。下面是课程链接:
http://vision.stanford.edu/teaching/cs231n/
接下来你可以看Caffe源代码,关于Caffe,它是一个深度学习框架,在实际工程应用上使用的较多,是主流框架之一,后面会介绍如何搭建Caffe框架,以及如何训练数据,实现深度学习,下面给出它的官网链接:
http://caffe.berkeleyvision.org/
主要看Caffe介绍,下载源码便可,后面会详细展开Caffe的安装和使用以及算法和代码实现。
有两个重点,一个就是“im2col在做什么”, 一个是protocol buffer里面的prototext怎么用。关于重点“im2col在做什么”,可以参考下面这个链接,里面有Caffe的开发者(中国国籍贾扬清)的回答,很直观。下面给出知乎问答的链接:
https://www.zhihu.com/question/28385679
基本上Caffe属于入门了就能很快精通的库。
掌握好Caffe的指标,我认为可以是训练百万级的数据,能够实现较好的拟合效果,并将模型用于实现一个工程项目。在这个过程中,需要理解机器学习的相关算法,才能够更好的调节参数,拟合数据,做到如此,便可以认为已经入门深度学习了。所以,建议大家在实践中学习。