2024-03-19 正则化

1dc0ec4e5d2a4ee789f09985c4a29b71.png

过拟合(Overfitting)
过拟合指的是模型在训练数据上拟合得太好,以至于它开始捕捉数据中的噪声而非潜在的规律。换句话说,过拟合的模型对训练数据过于敏感,包括那些不规则的、随机的或错误的变动。因此,虽然这样的模型在训练集上的表现可能很好,但它在新的、未见过的数据上的泛化能力通常很差。

正则化(Regularization)
为了避免过拟合,我们可以使用正则化技术。正则化涉及向模型中添加一个惩罚项,该惩罚项对模型的复杂度进行惩罚。这种惩罚通常是通过将模型参数的某种范数(例如L1范数或L2范数)加到损失函数中来实现的。这迫使模型在最小化训练误差的同时,保持参数值较小或稀疏。

  • 岭回归(L2范数)
from sklearn.linear_model import Ridge
model = make_pipeline(GaussianFeatures(30),Ridge(alpha=0.1))
basis_plot(model)
  • Lasso正则化(L1范数)
from sklearn.linear_model import Lasso
model = make_pipeline(GaussianFeatures(30),Lasso(alpha=0.001))
basis_plot(model,title='Lasso Regression')

参考:
[1]美 万托布拉斯 (VanderPlas, Jake).Python数据科学手册[M].人民邮电出版社,2018.

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 姓名:黄永飞;学号:17040520006;学院:机电工程学院; 转自: https://www.jianshu....
    嵌入式创新阅读 683评论 0 0
  • 机器学习模型需要拥有很好地泛化能力来适应训练集中没有出现过的新样本。在机器学习应用时,我们经常会遇到过度拟合(ov...
    owolf阅读 9,922评论 0 21
  • 向你的模型加入某些规则,加入先验,缩小解空间,减小求出错误解的可能性。你要把你的知识数学化告诉这个模型,对代价函数...
    dingtom阅读 603评论 0 0
  • https://blog.csdn.net/liujiandu101/article/details/551038...
    dopami阅读 1,091评论 0 1
  • 一、正则化基础 正则化等价于结构风险最小化,就是在经验风险后面加上了表示模型复杂度的正则化项或惩罚项。 正则化的作...
    arrnos阅读 1,795评论 0 4

友情链接更多精彩内容