昨天是学习深度学习的第二天,学习到了一个很重要的现代神经网络--卷积神经网络,就是它开启了对于现代神经网络的第三次研究。
卷积神经网络是什么个意思了?就是在之前所讲的神经网络之前,现加入一些卷积层,对网络的输入先进行一个预处理的过程。在这里说明一下,卷积神经网络主要应用在图像识别上面,吴恩达在谷歌主要做的工作就是这个。我们对一张简单的图像进行一个预处理后,会得到我们用人眼,人脑所不能体会到的一些特征,这些特征甚至我们都不能对其进行描述。我们都知道机器学习的一个很重要的环节就是认为为其打标签,也就是为图像添加一定的特征,让计算机能够识别到这些特征。比如说,有耳朵的是猫,有四条腿的是猫,有两个眼睛的是猫......在满足了一切标签之后就可以判断出来这是不是一只猫。卷积神经网络可以为我们自动提取标签,这是其最主要的功能。
在网络中,经过了一次卷积之后,会得到一些特征;再经过次卷积又会得到一些更为清晰,明显的特征,经过多次卷积过后就会得到比较完整的特征。在将其输入到我们的传统网络中去进行处理,判断。我们在这里将传统网络的哪几层连接称为全连接层(FC)。
卷积的过程很复杂,在将图片进行数字化过后,一般会得到一个3维矩阵,三原色嘛,每个颜色都有对应着一个矩阵,这三个矩阵是放在一起的。卷积的时候对某一块小的三维矩阵进行卷积,卷积也就是要和对应的一个三维矩阵分别进行对应项相乘在相加,之后在加上预先设置的一个偏置项,就获得了一个特征图的一个数。之后,再对另一块小的三维矩阵进行卷积,再获得一个数。不断的平移(包括上下左右),就会获得一个较大的二维数组。这个三维矩阵是通过矩阵平移获得的。每次平移都是一样的,这都是预先设置好的规定。当然,考虑到对于图形数据的充分利用,而且,每次平移的时候会有两个三维矩阵重叠的地方,我们会对图形进行一定的扩充,当然扩充也就是用0来填充。为了让每个数据都可以利用均等的次数。我们前面讲的对于三维矩阵进行卷积是和另一个三维矩阵。我们称另一个三维矩阵为过滤器filter,每次卷积都对应着同一个filter。当然我们在同一层卷积操作上可以经过多次filter,一个filter获得一个特征图,n个filter就获得n个特征图。在加上每次filter所获得的特征图就可以组成一个新的三维矩阵。它将作为下一次操作的输入值。
卷积神经网络的内容是在太多,其余内容明天在继续复习。