ICCV2019超分变率专题——EBRN

EBRN是ICCV2019会议上关于单幅图像超分辨率(SISR)的论文,文章认为图像中低频和高频信息的复杂度是不一样的,应该采用表征能力不同的的模型来分别处理。基于这种理念提出了一种嵌入块残差网络--EBRN。具体做法是,采用模型中不同的模块恢复不同频率的信息,对于低频信息,采用网络中浅层的模块进行恢复,对于高频信息采用深层模块进行恢复。

1.简介

SISR旨在从LR中恢复出丢失的结构和纹理信息。深度神经网络和循环神经网络在该领域取得了较好的研究成果,而基于深度模型的方法没有考虑图像的频率特性。文章认为,自然图像的特征是由不同的信息频带组成,每个频带包含不同复杂度的结构和纹理。在包括SISR在内的图像恢复任务中,每个波段信息的恢复都需要一个特定的恢复函数。考虑到不同频段的特征分布不同,低频信息由更简单的结构和纹理组成,需要更简单的函数进行恢复;高频信息由复杂的结构和纹理组成,需要更复杂的恢复功能。

现有的基于深度模型的方法无法区分图像的频率。这些模型中每一层的任务是根据前一层的特征恢复所有的信息。模型复杂度与频率的不一致性是制约深度CNN方法性能的关键问题。基于以上分析,提出一种EBRN网络。通过采用复杂度不同的子网对不同频率的纹理进行恢复。

本文主要贡献主要有三点:

1.提出图像中不同频率的信息需要通过不同复杂度的模型进行恢复。在坏的情况下,较低频率的信息可能会被较深的模型过度恢复,而较浅的模型会对较高频率的信息恢复不足。

2.提出了一种块模块(BRM),它在将难以恢复的信息传递给更深层次的模块的同时,尝试恢复图像的结构和纹理。这使得每个BRM都能聚焦于适当频率的信息,这对于保证模型复杂度与图像频率的相关性非常重要。

3.提出了一种嵌入多个BRMs的新技术,可以有效地提高基于各模块输出的最终重建质量。我们也以经验证明所提出的模式优于最先进的。

2.相关研究工作介绍

当前超分辨问题的研究方向有以下几个方面:       

 通过优化CNN模型框架,介绍了基于深度学习的超分辨率经典模型,包括SRCNN、VDSR、DRCN、EDSR等,这些模型都是基于优化PSNR/SSIM的;

基于优化损失函数:较为常见的有L1、L2,以及后来的perceptual loss 和adversarial loss.介绍了基于优化感知损失的SRGAN 、SFTGAN模型。            

基于扩大放大倍数上,x2,x3,x4的研究工作已经快接近瓶颈,x8放大成为研究热点。

通过文献阅读,当前没有人研究模型复杂度和图像频率信息,本文就是基于此开展研究的。

3.EBRN网络架构

3.1BRM

BRM是模型中最基本的模块,它将数据量分为高分辨流和反向投影流。高分辨流主要用于恢复低频的结构和纹理信息,反向投影流则计算高频信息,每个BRM都堆叠在它的一个先行BRM的反向投影流上。每一个BRM负责较低频率的信息恢复,将较高频率的信息传递给较深的BRMs。

所有的卷积层都使用了3 x3 x64个卷积核。除向下采样外,其他层的步长为1x1,填充大小为1x1。下采样层的参数是根据上标度因子设置的,即,则输出特征图的空间大小与输入特征图相同。局部残差学习阶段是为了鼓励训练的快速收敛,就像在其他残差学习方法中一样。通过这样的设计,我们从经验上发现,超分辨率流可以恢复较低频率的信息,而难以恢复的较高频率的信息会传递给后续的模块。

3.2EBRN网络架构

在第一个BRM之前,提出了一个初始特征提取模块来表示特征映射的形状。在该模块中,第一个卷积层生成256通道的feature map,然后将两个卷积层堆叠在一起,每个卷积层输出64通道的feature map。这些层的卷积核大小为3×3。

将第一个BRM叠加在初始特征提取模块的输出上,将第二个BRM连接到第一个BRM的反向投影流的输出上,以此类推。每个BRM负责恢复前一个BRM的反向投影流产生的剩余特征图。请注意,最后一个BRM只包含丢弃反投影流的超分辨率流

这样,较低频率的信息只通过模型复杂度较低的较浅的BRMs。这部分信息的过拟合问题是可以避免的。另一方面,更高频率的信息被传输到模型复杂度更高的BRMs中,从而缓解了欠拟合问题。

另一个重要的观点是,我们将某些频率的信息与具有适当复杂度的子网联系起来。它不需要适合一个简单的模型在复杂的纹理,也不适合一个复杂的模型在简单的结构。因此,这些子网络中的参数数量可以显著减少,但对相应的信息保持较高的恢复性能。

f:卷积函数

这个方式,输出更加平滑。

重建层:此外,为了避免训练中的梯度消失问题,我们建议将每个BRM的输出直接连接到图像重建模块。该设计有两个优点:1)缩短了深度BRMs的误差传播方式,提高了训练的收敛速度; 2)模型的中间特征映射被重用进行重构。重构子网采用3×3×64个卷积核,最后一层生成3通道RGB图像。

4.EBRN与其他网络的比较

4.1EBRN 和残差网络

残差网络最近在各种计算机视觉任务中表现优异。在SISR中,第一个使用残差学习思想的模型是VDSR,它取得了优于竞争对手的性能。与传统CNN模型相比,残差网络的优势在于残差学习促进了网络中特征的传输,缓解了梯度消失问题,使得网络更容易训练。

在这项工作中,我们利用了不同于传统的残差网络的残差学习思想。例如:

①由于BN层限制了特征归一化过程中中间特征的范围灵活性,所以本文模型没有使用batch normalization (BN)层。

②另一个重要的区别是残差是如何计算的以及残差所传达的信息。在残差网络中,剩余信号是输入和输出的差值。在该模型中,一种残差信号是某一频率范围内的信息;残差信号的另一种类型是原始LR特征与反投影LR特征之间的差异。在每一个BRM中,第二个残差信号对于SR是很重要的,因为它明确地传达了哪些信息需要后续BRM恢复。

4.2EBRN vs. Deep Back-Projection Network

DBPN:该方法利用迭代的上下采样层,为每个阶段的投影误差提供了误差反馈机制。误差可以有效地提高模型中深层的恢复效果。

两种方法的不同之处在于:

①在上投影单元和下投影单元中,DBPN将LR残差直接映射到HR空间,而我们的模型中LR残差包含更高频率的信息,这些信息被反馈到更深的子网络中进行恢复;

②DBPN利用LR残差和HR残差,目标是每个上、下投影单元尽量减小残差,而我们的方法将残差信号与不同频率的信息联系起来,每个BRM负责恢复相应的信息。动机的不同导致模型的参数比DBPN少,但性能比DBPN有提高。

5.实验验证

training: DIV2K,一个高质量(2K分辨率)图像恢复数据集,包含800张训练图像、100张验证图像和100张测试图像。

up-scaling factors: ×2, ×4,×8

testing: Set5 [4], Set14 [46], BSDS100, Urban100, Manga109

激活函数:PRelu

Optimization:Adam

learning rate:10−4

5.1不同频率范围的信息应该由不同复杂度的模型处理的动机。

为了验证这一点,我们在图6中演示了不同频段上不同brm输出的能量分布。利用小波变换的不同能级系数,计算了能量在不同频段的分布。结果表明,浅层BRMs的输出包含更多的低频信息,而深层BRMs的输出则倾向于恢复更多的高频信息。

5.2运行速度、最优BRM数验证

5.3验证了本文方法使用参数的数量和PSRN效果

5.4效果对比

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容