过拟合的一些问题

过拟合,欠拟合与模型的容量息息相关。模拟的容量指其拟合数据的能力,容量低的模型难以拟合训练,出现欠拟合,容量高的模型则过拟合。

数据和模型容量不匹配,是过拟合出现的原因。那么为了解决过拟合,一是从数据角度:增加数据来源,或使用data augmentation的一些方法扩充数据。

从增加模型容量角度可以做的改变就更多了。一种是选择假设空间(hypothesis space)即改变学习算法的函数集,如一阶转高阶,改变模型的选择;或者使用正则化项控制算法的性能,降低泛化误差。在深度学习中,对于深度神经网络,还可以使用减少网络层数,神经元个数,缩短训练时间,增加(数据,权值,输出)的噪声, 使用dropout随机抛弃掉一些神经元。

另一种思路是通过设置验证集或交叉验证或者使用多模型集成学习(bagging, boosting),来控制学习算法的超参数,所谓超参数,如模型的阶数,权重衰减率等,如果在训练集上训练超参数,这些超参数总是趋向最大可能的拟合模型,所以将数据分成两个不相交子集,一个用于训练,一个用于验证。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 32,051评论 2 89
  • 机器学习是做NLP和计算机视觉这类应用算法的基础,虽然现在深度学习模型大行其道,但是懂一些传统算法的原理和它们之间...
    在河之简阅读 20,609评论 4 65
  • 首页 资讯 文章 资源 小组 相亲 登录 注册 首页 最新文章 IT 职场 前端 后端 移动端 数据库 运维 其他...
    Helen_Cat阅读 3,939评论 1 10
  • 好久没有交作业,我是个面对压力就跑的人,我真的写不出。也可以说我不想面对自己,不想变得沉重,或者不知道该如何面对自...
    别提那壶阅读 250评论 0 0
  • 我从千里之外来到你 新的每一天 祝福你 岁月趟趟 你虽没有南国之温柔似水 不具乳汁般的细腻 却 你的身后燃烧着红色...
    海舟的露阅读 257评论 1 2