过度拟合

针对拟合函数,通常会有三种状况,分别是欠拟合,正常和过度拟合

左:欠拟合 中:正常 右:过度拟合

欠拟合是指假设函数对于样本集本身就拟合结果不佳,很容易直观看出来

而过度拟合是指假设函数为了完美的拟合样本集,引入了过多的高次项,虽然对于样本的拟合十分良好,但是与实际情况完全偏离


针对过度拟合,解决方案有几种:

1、减少特征项的个数:

·通过人工挑选特征

·使用模型选择算法

2、正则化(Regularization)

·留住所有的特征项,不过减小θj的大小

·对于有大量有微小影响的特征项的情况十分有效


正则化(Regularization):

对于假设方程,我们都是求代价函数(cost function)的最小值来达到最佳拟合,然而这无法避免过度拟合,所以我们将代价函数进行修改:

新的代价函数

其中λ是正则化参数


线性回归和逻辑回归:

因为我们的代价函数已经发生了变换,所以针对线性回归和逻辑回归的求值过程也会有所改变:

j=1,2,3...n

因为线性回归和逻辑回归仅仅是hθ(x)有所不同,可以通用,不过此处针对θ0则需单独处理,因为之前正则化时是从θ1开始而不是θ0


正规方程(Normal Equation):

在之前讲正规方程时,曾经提到XT·X的逆矩阵有可能不存在,其中一个原因是特征过剩,特征n的个数比训练集m的个数还多,而正则化可以解决这个问题:

新的正规方程

因为引入了正则化,所以我们的正规方程也有所变化,变为如上图,此时括号内的矩阵行列式不为0(还没证出来),所以正则化可以解决此问题

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 定义 对于线性回归或逻辑回归的损失函数构成的模型,可能会有些权重很大,有些权重很小,导致过拟合(就是过分拟合了训练...
    Alfie20阅读 5,712评论 0 0
  • 过拟合(Overfitting) 先看图解释过度拟合 左边的结果,拟合不好,偏差过高,意味着系统误差设置过高 中间...
    袁一帆阅读 5,037评论 0 51
  • 用处 普通基于元素或基于类的样式定义像这样 p {color: red;text-align: center;}这...
    西北偏北阅读 5,133评论 1 3
  • 你为什么不允许自己真实? 当一个人的真实自我的某些部分没有被养育者接纳时,她对那些部分就会很不自信。不自信的程度视...
    星空kris阅读 4,455评论 0 6
  • 《醉花阴·情暖中秋》 情暖中秋扶贫路,温情花间露。 国庆又中秋,邀月开怀,明月依山谷。 绿竹小道林荫处,有景观晨雾...
    吴墨海2014阅读 3,369评论 3 5

友情链接更多精彩内容