1.卷积通道
多通道卷积

1.png
这是一个三通道图片的卷积计算,每一个通道对应一个卷积核的一个通道(三通道的卷积核为一个卷积核),三个通道分别卷积计算完成后再相加得到单通道的卷积结果。故有多少个卷积核进行计算,结果的图片就有多少个通道。
2.全连接层

2.png
全连接层是由前一层通过相同大小的卷积核进行卷积后相加得到的,多个通道组成一个一维向量。

3.png

4.png
3.softmax
全连接层或其它层,通过一维向量进行归一化概率,生成每个分类的概率
4.学习率 learning rate
5.PNG
学习率相当于梯度下降距离的权重,学习率越小,达到最值的迭代步数越多,学习率越大,可能会在最值点附近震荡,所以应先用大学习率进行训练,达到一定效果时再减小学习率,直到接近最值点。
-
PSNR和SSIM
PSNR:峰值信噪比(值越高,生成的图片效果越接近真实图片)
8.PNG
MAX:图像的灰度等级,一般是255
SSIM:结构相似性指标(可以更好的反映人眼的直观感受,值越大效果越好,最大为1)
结构相似度指标从图像组成的角度将结构信息定义为独立于亮度、对比度的,反映场景中物体结构的属性。
将失真建模为亮度、对比度和结构三个不同因素的组合。
用均值作为亮度的估计,标准差作为对比度的估计,协方差作为结构相似程度的度量。
9.PNG
6.感知损失Perceptual Loss
原论文包括特征重建损失和风格重建损失两部分,后续引用多只涉及特征重建损失。
即重建图像和真实图像在VGG16的池化层中输出的矩阵的对应元素差的平方和。
6.PNG
7.PNG
7.VGG16
https://dgschwend.github.io/netscope/#/preset/vgg-16