神经风格迁移

准备

一个style image 、一个 content image以及一个训练好的CNN(一般用VGG网络就可以,可以去github上下载)

style image
content image

输入

有三个,分别是:noise image、content image、 style image

功能

将style image和content image进行融合,即将style image的风格放到content image中,但又不损失content image里面的内容。

原理

从卷积神经网络的可视化可以知道,在低层的神经网络中会有一些纹理、颜色的一些低级特征识别,越往上层,学习到的feature map越复杂,就会出现一些特定的pattern,比如:人脸、鸟的腿等等。(具体可以参看这个可视化的paper

1.所以考虑让content image在接近输出的神经层算content_feature_maps,让style image在接近输入的神经层算style_feature_maps.

2.对noise image做相同的操作,得到noise_style_feature_maps (获取maps的层数和style image相同)和 noise_content_feature_maps(获取maps的层数和content image相同)

3.计算noise_content_feature_maps和content_feature_maps之间的loss,记为content loss,计算方法如下:
MSE=mean((noise\_content\_feature\_maps - content\_feature\_maps)^2)

4.之后计算noise_style_feature_maps和style_feature_maps之间的loss,记为style loss,计算方法如下,即各自gram matrix的MSE:

  • 什么是gram matrix?:

    gram matrix是:一个vector x(列向量),如果计算它的gram matrix就是x'x,gram matrix可以衡量两个feature map之间的相似程度。

  • 为什么不直接用MSE呢?

    因为style衡量的是纹理、颜色等一不一样,所以计算的是某种相关性。而不需要像content那样每个像素点都比较接近(即内容比较接近),所以在这里计算的是gram matrix的MSE。
    MSE_{gram\_matrix} = mean((gram\_matrix_{noise\_style\_feature\_maps} - gram\_matrix_{style\_feature\_maps})^2)

5.最后呢,最小化style_loss+content_loss

结果

下面是我自己跑出来的结果,比较难看,但是已经有了风格迁移的味道,有些内容有点失真,我感觉应该是训练的不够,但是鉴于我的电脑太久远了,一运行就卡的不行,就这样的结果也是跑了很长时间的了。


鬼畜图片

代码

我的github。代码里面只需要运行style_transfer.py文件即可。还有一个VGG网络的训练参数文件“vgg16.npy”需要下载,这个文件比较大,上传太费时了,可以去github上找,或者网盘。

有什么问题可以及时留言,欢迎批评指正!

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 上周六,很幸运有机会可以站在270人的场地里进行了一场6分钟的演讲,作为一名演讲小白,虽然讲的不算出色,比起其他的...
    茜喵阅读 893评论 6 16
  • 姓名:吴广明 公司:力创商业地产 盛和商学第346期努力二组副队长 【知~学习】 《六项精进》大纲背诵1遍共21...
    吴广明阅读 107评论 0 0
  • 1989年我还没出生。可庆幸的是我是一个爱听故事的人,而且我身边有那么多有故事而且爱讲故事的人。所以听他们的...
    一只古灵精怪的猫阅读 625评论 0 0
  • 你喜欢玩黏土吗? 今天我来给你展示怎样玩可以吃的“黏土”。 首先,取一块可以吃的“黏土”。先来一块儿绿色的吧。(配...
    彪悍另一只猫阅读 1,488评论 27 34