吴恩达机器学习—正则化

过拟合问题

欠拟合与过拟合

当变量过少时,可能存在欠拟合;当变量过多时,会存在过拟合。过拟合可能对现有数据拟合效果较好,损失函数值几乎为零,但是不能进行泛化时,即不适于非训练集的其他数据。

如何解决过拟合问题

特征变量过多造成过拟合

绘制假设模型图像,但当特征变量变多时,绘制很困难。当变量过多而训练数据较少时,容易出现过拟合。

过拟合的解决办法

解决过拟合问题,通常有两种方法:一种是减少特征的数量,可以通过人工选择特征,也可以通过模型选择算法进行处理。这种方法存在的问题就是,可能会损失某些信息,可能所有的特征对于数据来说或多或少都是有用的,但是删除某些特征就会造成信息的缺失。第二种方法就是正则化,它保留所有的数据但是降低参数的量级,使每一个变量都对预测有影响,但是每个特征的影响程度较小。

当参数过多时,会存在过拟合现象,假如我们在损失函数中加入一项作为惩罚,如加入1000\theta _{3}^2 ,当参数\theta _{3} 过大时,会使得损失函数变大,而我们的目标是损失函数最小化,因此,会迫使参数值变小,当但数值值趋近于0时,近似于新加入的项1000\theta _{3}^2 趋近于0,相当于去掉这一项,此时,模型又近似于二次函数形式。解决了过拟合问题。

多参数情况下的正则化

当参数很多时,无法确定那些参数对模型影响大,哪些影响较小。无法对参数进行选择约束。因此,我们就从整体上对参数进行约束,加入上图紫色的正则项,对除\theta _{0} 以外的所有参数进行约束。\lambda 为正则参数。

加入正则项以后的损失函数
正则参数的选择

当正则参数取值较大时,惩罚作用较大,会使得所有参数的取值近似于0,此时,会使得假设模型中参数项以外的项趋近于0,假设模型近似于一条直线,造成欠拟合。

线性回归的正则化——将梯度下降和正规方程用于正则化的线性回归

正则化后的损失函数

加入正则项以后,损失函数如上图所示,我们的目标依旧是找到最小化损失函数对应的参数值。通常有两种方法,梯度下降与正规方程。

正则化损失函数的梯度下降

在正则化损失函数中,梯度下降的原理与线性回归中一样,只是在迭代过程中将\theta _{0} 单独分列出来,因为在正则化过程中只对\theta _{1} -\theta _{n} 进行惩罚。在对\theta _{1} -\theta _{n} 进行梯度下降时,加入正则项。化简后的梯度下降迭代公式如上图最后一个公式所示,第一项中的(1-\alpha \frac{\lambda }{m} )是一个略小于1的数,假设为0.99,第二项与原梯度下降公式相同,因此,在进行每次迭代时,都是将原参数乘以0.99,每次迭代将参数缩小一点。

正则化的线性回归中的正规方程

加入正则项以后,在构建正规方程时,相当于在正规方程中加入了一个(n+1)*(n+1)的矩阵,首行首列元素均为零。

正则化后的正规方程

加入正则项以后,只要\lambda >0是成立的,则可以保证矩阵是非奇异矩阵,确保矩阵可逆。因此,正则化还可以解决奇异矩阵的问题。

logistic回归中的正则化问题

logistic回归中的过拟合问题

在logistics回归中由于特征变量增加,也会带来过拟合问题,在模型中加入正则项解决该问题。

正则化的logistic回归的梯度下降

在正则化的logistic回归模型中进行梯度下降的方式与线性回归中的方式相似,上图方括号中的式子为正则化后的损失函数。但是这里对h_{\theta } (x)的定义与线性回归中的不同,这里表示的是一个sigmoid函数。

高级优化算法
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342

推荐阅读更多精彩内容