卷积神经网络
Conv Net Structure
Focusing on local property - Conv layer
以音频为例, 可以将一段音频切割成一段段, 之后连入全链接层, 这是最简单的神经网络。
当我们想关注音频局部信息,例如音频的频率等。所以通过构造一组神经元 只关注局部以形成对应的 feature。 Conv layer A 插入在fully-connected layer F 之前。
实际上卷积层不止链接两个点 。当卷积层多层复合时, 神经网络可以捕捉到更抽象、更高维的 feature。
Invariance -Pooling layer
卷积层后经常交织着池化层
- Invariance - translation 、 rotation、 scale
- Dimension Reduction ,Data Compression
- Avoid Overfitting
-
Control the length of this output layer
Max-pool 同时有 “Zoom-Out”作用,扩大视野。
2-D CONV - 图像 3-D CONV - 视频