正则化之参数惩罚

在线性模型中,为了预防overfitting过度拟合,添加了惩罚项\frac{\lambda}{2m}\sum_{1}^m\theta_{j}^2

但是为何要加入这一惩罚项令人困惑。

预防过拟合这个答案给出了解释:

当过拟合的时候,为了匹配测试集里的所有数据,泛化不好的高阶函数会产生很大的抖动,抖动导致导数变得很大,需要系数\theta很大才能拟合所有的数据。所以加入惩罚项可以惩罚系数非常大的情况,使得选择系数避开这些抖动非常大的系数。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容