过拟合的问题(The problem of overfitting)

正则化可以减轻过拟合问题。

欠拟合(underfitting)
高偏差(high bias)

合适

过拟合(overfitting)
高方差(high variance)

泛化(generalize):指假设模型能应用到新样本的能力。


在线性回归中:

在逻辑回归中:

特征太多,数据量太少,过度拟合就会发生:


解决过度拟合:

方法:

  1. 减少特征数量:
    手动选择
    使用模型选择算法(后面会讲)
  2. 正则化(regularization)
    保留所有的特征,但是减少参数θj的大小(magnitude/values)
    当我们有很多特征的时候依然工作很好,并且每个特征都对预测y有一定的贡献
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 过拟合问题(The Problem of Overfitting) 如上图所示,第一个采用单变量线性回归模型来拟合...
    SmallRookie阅读 3,641评论 0 1
  • 机器学习是做NLP和计算机视觉这类应用算法的基础,虽然现在深度学习模型大行其道,但是懂一些传统算法的原理和它们之间...
    在河之简阅读 20,729评论 4 65
  • 一、过度拟合 看看另一个例子 对于第一个图,使用两个变量,可以拟合出一条直线,可以看出效果不是很好,这也是一个欠拟...
    安东可阅读 5,059评论 0 0
  • 转自july算法班: 模型的状态分为过拟合和欠拟合 过拟合(overfitting/high variance) ...
    士多啤梨苹果橙_cc15阅读 6,549评论 0 0
  • 风,好大 我伫立在风中 等待、、、、、、 风,好冷 冷得让人疼痛 默默的 一种忧伤 涌上心头 风,刮起悲凉的心 泪...
    天魁诗词书画阅读 1,576评论 0 0

友情链接更多精彩内容