深度学习中数据到底要不要归一化?实测数据来说明!

在做超分这种回归类的模型时候,对于数据要不要做标准化预处理,网上也没个专业的说法,令人头大。

CV里面一般的图像都是0-255的范围,这个比较好处理了,不好进行标准化就直接除以255进行归一化,但是在其他领域的话,有时候数据集的极差比较大,比如降雨这种。

那么,在深度学习中处理图像数据的时候,到底要不要对数据进行标准化?


下面记录一些自己的实验。

测试

按照控制变量法的原理来做,其他的参数都不进行调整,只调整2个部分:

  1. 是否对输入数据(X)做标准化?
  2. 是否在网络中加入BN层?

模型使用FSRCNN(之前文章复现过),按照上面两个变量的组合,一共有4种情况,分别进行试验。

1. 既不做标准化,也不加BN层

对输入数据不做任何处理,直接扔进网络,效果GG,直接没算出来loss:

感觉是loss太大,溢出了。

2. 对X做标准化,不加BN层

对X做标准化处理,模型中不加BN层,loss直接算不出来,GG:

3. 不对X做标准化,加上BN层

不对输入的X做任何处理,仅在模型的卷积层后加上BN层,其效果如下:

训练100个epoch的误差曲线:

看起来是正常的,没有问题。

4. 对X做标准化,且加上BN层

对输入的X数据做标准化(减去mean,除以std),且在模型中加上BN层。

结果显示第一个epoch可以计算出loss,但是验证集的loss非常的大:


可以说完全超出了可接受的程度。

GG。

补充测试

上面的测试中发现,如果对输入的X做了标准化,最后的loss就会很大。考虑到仅对输入的X做了标准化,并没有对Y做,所以补充下对Y也做标准化的测试(均值和方差就直接用X的)。

5. 对X和Y都做标准化,不加BN层

对输入的X和Y都进行标准化,但是模型中不加BN层,训练集的loss相比之前不对Y进行标准化的测试小了很多:

训练
验证

误差是正常的,跟上面不对输入X做处理,模型中加上BN层的误差差不多,但是收敛的更快了

6. 对X和Y都做标准化,加上BN层

用同样的mean和std对X和Y做标准化,且模型中加上BN层,效果如下:

可以看到收敛的更快,误差跟不加差不多。

总结

通过上面的几个测试可以发现:

  1. 如果不对输入数据做任何处理的情况下,模型中加入BN层,有助于正确计算loss和使得模型收敛,但是收敛速度要慢一点;
  2. 如果要对输入数据做预处理,根据上面的测试结果,是需要对X和Y都做相同的处理才可以得到理想的结果;
  3. BN层可以提升模型的效果;
  4. 对X和Y做合理的预处理也可以提升模型的效果。

思考与个人感悟

  1. 为什么对输入数据做标准化有助于提升模型的效果,且为什么应该对X和Y做同样的处理?

上面我测试的案例是一个回归问题,且X和Y的数值范围相差不大。如果用地理学的角度来解释,个人觉得深度学习模型学习的是一种end-to-end的映射关系,存在一个尺度问题,如果只对X或者Y做预处理,会使得两端的空间(指的是特征空间)差异变大需要学习的映射就会变得更加的隐晦。而同时对X和Y进行预处理,压缩了这种特征空间的变异性,所以使得要被学习到的映射变得简单了,或者说变的更加的“可视化”。

举个例子。就好比:

(1)在用google earth看地球(漫游)的时候,如果你的视野高度放的很高(根据目标的不同,选一个合同的视野高度),你确实可以看到两个地方的宏观差异,但是细节差异看不清楚(对应的就是对X和Y都不做预处理的情况,这时候的模型效果就会很差,因为关注的是细节信息);

(2)如果只对X或者Y做预处理,就好比两个人同时在google earth上进行漫游,但是一个人视野高度特别低,一个视野高度特别高,这时候就算两个人同时将视野聚焦于同一个城市/地区,两者看到的纹理也是不一样的,这种情况就不好进行对比(对应上面只对X做预处理,不对Y做,这时候模型效果也很差,因为无法建立起有效的联系);

(3)同时对X和Y做标准化的情况就好比固定了视野高度,且高度合适,不至于视野高度太高导致需要看的目标区域太大,看不清楚细节;又不至于视野高度太低,导致看到的细节太多。要知道细节太多,需要学习的映射就越复杂,学习的难度也会更高(对应上面对X和Y都做同样的预处理)。

  1. 为什么加入BN层有助于提升效果?

个人认为可以把BN层看作是一个(特征)尺度固定器,当两个end的特征空间差异过大的时候,将其简化;当差异过小的时候,就把尺度放大一点,有助于模型“看清”差异,起到了提升模型效果的作用。

根据上面的实验来看,看来深度学习跟人脑一样啊。。。越简单的映射学习起来越得心应手,如果太过于复杂的映射,可能就得多在模型上下功夫了。

(上面写的仅是针对个人案例的测试,其他的还是要按照通用做法来进行,比如机器学习中如果特征的尺度差异过大,肯定是必须要进行归一化的等等)

参考

【1】https://machinelearningmastery.com/how-to-improve-neural-network-stability-and-modeling-performance-with-data-scaling/
【2】https://inside-machinelearning.com/en/why-and-how-to-normalize-data-object-detection-on-image-in-pytorch-part-1/
【3】https://towardsdatascience.com/why-data-should-be-normalized-before-training-a-neural-network-c626b7f66c7d
【4】https://datascience.stackexchange.com/questions/22776/is-it-valuable-to-normalize-rescale-labels-in-neural-network-regression

本文由mdnice多平台发布

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容