A网络是生成网络,B网络是用来计算损失函数的(B网络是现成的用的别人的网络,vgg,就是用来提取特征,计算损失的。用vgg_net能很好提取到它的特征。),A每生成一次都能根据B提取的特征计算一次误差,用这误差去优化A网络。训练完成之后,就不需要B了,就能直接用A网络生成y_hat,完成风格转换。
Content是8万张各种各样的生活中的图片,然后把他们做一个融合。上面下面两种误差可以分别给一个误差的权重。
在算一个epoch里面有多少个batch size的时候,直接吧余数给去掉,就相当于只是丢掉了很小一部分训练数据而已。方便了编程。