卷积神经网络(Convolution Neural Network)
基于全连接层和CNN的神经网络示意图
全连接的局限性
由于全连接所有数据会被拉平成1维数据,数据的"形状"会被忽视掉,所以无法利用与形状相关的信息.
而卷积层会以原始维度(图像就是3维)接收输入数据,同样以3维形式输出到下一层,因此有可能正确理解图像的形状数据.
卷积运算
其中滤波器(Filter)又称"核"
填充
幅度为1的填充(padding),表示在输入矩阵周围填充1像素的'0',填充后矩阵变成(6,6)的形状.填充的主要目的是为了使输出数据的形状和输入数据一致
步幅
应用滤波器窗口的间隔变为2个元素.
已知填充和步幅,输入形状和输出形状的关系
假设输出大小为(H,W),滤波器大小为(FH,FW),输出大小为(OH,OW),填充为P,步幅为S,则存在以下关系
三维数据的卷积运算
池化层
池化是缩小高、长方向上的空间的运算.下图展示了步幅为2的Max池化,即每次从2*2的目标区域中获取最大值的操作,一般来说初花的窗口大小会和步幅设定成相同的值.池化对微小的数据偏差具有鲁棒性.