12-Regularization

在VC理论中, 仅仅考虑了Eout < Ein + \delta, 其中\delta 与growth function, N相关, 但是却没考虑到target function的影响, noise的影响, 现在我们要来补全它。

  • 下面从一个简单的例子开始。还记得我们之前的, 给定两个点, 用一根线拟合sin的例子吧, y = ax + b表现的并不那么好, 可以看出来它的variance非常大, 虽然bias小(y=b这个简单的假设反而variance没那么大)。 而当我们加了regularization的时候, things become better。 Regularization减小variance的代价是稍微增大了bias, 而显然这是可以接受了。 Regularization在这里的一种理解是假如我们有0,1,2,3阶模型, regularization不选择到具体的模型, 而是处于a gap between them。


    example

    winner
  • 多项式模型。更一般化的, 我们将线性回归表达成矩阵/向量的形式,看成是变换到Z空间,再做回归, 每个Z空间对应一个勒让德多项式。采用勒让德多项式的好处是它们之间两两正交, 代表着假设空间是不会重复的。 然后就是跟之前一样的求解步骤了。


    polynomial

    sol
  • 事实上, 我们可以加constrain, hard的形式是直接把某些项置零, 这样子有些粗暴, soft的形式是让w≤C, 加了soft constrain, VC维度更小(对不加constrain而言), better generalization。


    constrain
  • 那么如何求解constrain形式的规划问题呢。 问题的解空间是一个椭圆(蓝色), 而约束是一个圆(红色), 最优解存在与两者的梯度反向平行的位置上, 即夹角越大越好。 转成第二个表达式, 我们可以将问题重新转化, 可以看到C越大的话, \lambda就越小。


    constrain sol
  • 代入, 求解。 求解结果有点是矩阵加了扰动的意思???


    problem

    solution
  • 从结果我们看到, 需要选择一个比较好的lambda, 结果才能更好。


    Result
  • 上面提到的技术其实是称之为weight decay。 我们可以看到, 它就是在梯度更新的时候, 不选择原来的w(t), 而是让w(t)更小一些(1-xx), 这样可以防止w一直上涨的太厉害, 起到一种shrinkage的效果。另外, 我们也可以规定不同的w赋予不同的regularization, 起到importance emphasis的作用。


    weight decay

    weight decay2
  • 如果使用weight growth呢, 效果显然是不好的, Eout直线上升。 前面我们提到的随机noise是高频的, 而确定性noise也是非平滑的, 其实价格regularization就是让最终选择到的hypothesis更加平滑! 这样可以消除这两种noise的影响。


    weight growth
  • 更一般形式的表达。 相比于Ein, Eaug是Eout更好的表达。


    general
  • 如何选择regularizer呢, 指导思想是要往target function的方向去, 这个方向是一个更加平滑或者说让模型更加简单的方向。在神经网络中, 观察tanh函数, 如果w比较小, 那么激活之后就是在线性区域, 而如果w比较大, 激活之后就是1, -1 这样的布尔值了。 或者说, 我们可以删除权重, 这将使得VC维更小, better generation。 如图中的公式, 若w比较小, beta dominant, 若w比较大, 值接近雨1, beta diminish, 这样就起到了删除权重的作用了。


    choice

    NN
  • 更一般的, 用early stopping, validation来防止过拟合。对随机噪声来说, 如果它不存在, 我们就不用regularization了, 噪声越多, 需要的regularization也就越多了; 确定性噪声同理。


    regularizer

    lambda
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容

  • 2016.03.29 又是一年的春天来到了,在喵妈住院的一周,气温迅速就攀升到20度了。周围的柳树着急地抽芽,小区...
    摹喵居士阅读 190评论 0 0
  • (一)春雨 第一场春雨,来了。 来的那样悄然,来的那样安静。还来不及躲闪,就轻轻地,轻轻地落在你的脸颊上,落在你的...
    一片云_626e阅读 176评论 0 1