(1)卷积神经网络提出的缘由
图像的局部性:通常,检测一个图像的类别,不是整个图像决定的,而是一些局部区域决定的。
图像的相同性:对于不同图像,如果有相同的特征,这些特征会出现在图片的不同位置;也就是说可以用同样的检测模式去检测不同图像的相同特征。
图像的不变性:对于一个大的图像,对他进行下采样,那么图像的性质基本保持不变。
(2)全连接神经网络对于处理图像数据需要大量的参数去计算
全连接神经网络在处理图像分类任务时,会把每个像素放成一列向量。例如手写字体识别任务。那么1000*1000像素的图片输入层有1000*1000=100万节点。假设第一个隐藏层有100个节点,那么仅这一层就有(1000*1000+1)*100=1亿参数,参数数量太多同时没有利用像素之间的位置信息,对于图像识别任务来说,每个像素和其周围像素的联系是比较紧密的,和离得很远的像素的联系可能就很小了。同时梯度消散问题也不容忽视。
(3)可视系统是分级的
人们通过对猫的视觉系统研究发现,1可视皮层是分级的,神经-中枢-大脑的工作过程,是一个不断迭代、不断抽象的过程。2发现了一种被称为“方向选择性细胞(Orientation Selective Cell)”的神经元细胞。当瞳孔发现了眼前的物体的边缘,而且这个边缘指向某个方向时,这种神经元细胞就会活跃。即对物体边缘感兴趣,通过边缘特征来组成更大的特征。物体边缘是一个局部特征,我们通过卷积核来获取这种特征。于是出现了卷积神经网络。