2018-11-7 deep learning举例

以手写数字识别为例:

输入是256维的像素,输出是对应0,1,2,3,4,5,6,7,8,9的概率

第一步:选择模型:

选择一个合适的神经网络模型,全连接模型,CNN卷积神经网络模型等等
神经网络的层数与个数是难点!经验+直觉


loss function是交叉熵的方法
找到neural network的parameters 使得total loss最小 

step3:找到最优解

利用gradient descent寻找最优模型,但是因为深度学习的函数太复杂,要直接计算微分的话,计算量实在太大了,所以一般会用一个叫做 反向传播(Backpropagation) 的算法来做,这个算法会在之后详细介绍。

虽然我们是用 Backpropagation 来帮我们算微分,但是其实就连这个我们都不会自己去算,基本都是用一些工具来帮我们,比如 TensorFlow。到此结束了吗?没有的,人这么懒的生物,觉得 TensorFlow 也太复杂了,所以又写了一堆 API 去直接调用 TensorFlow ,这就是之后会讲到的 Keras,果然懒才能推动人类不断进步。

---------------------

作者:MemoryD

来源:CSDN

原文:https://blog.csdn.net/MemoryD/article/details/80307520

版权声明:本文为博主原创文章,转载请附上博文链接!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容