为什么要有验证集

想必都清楚为什么存在训练集和测试集.所以下面就是关于验证集存在的理由.

以线性回归为例(关于theta,lambda这些参数的含义参照Ng的视频):
通过训练集得到的theta值符合代价函数的最小值,但是这很可能存在过拟合的情况,所以这个时候就需要类似于lambda参数进行正则化,那么lambda参数就需要一个一个去试,比如说1,2,4,8,16...试了之后呢,怎么评判哪个lambda好,哪个不好呢,这个时候就需要验证集了.

总而言之,就是将theta和lambda等参数一组一组带入训练集中训练,得到结果交给验证集,由验证集得到最好的参数是哪一组,最后再交给测试集测试.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 以西瓜书为主线,以其他书籍作为参考进行补充,例如《统计学习方法》,《PRML》等 第一章 绪论 1.2 基本术语 ...
    danielAck阅读 10,144评论 0 5
  • 本文介绍机器学习算法的性能评估的方法,包括算法高偏差还是高方差的诊断,学习曲线等。从工程应用的角度来讲,算法只需要...
    kamidox阅读 8,446评论 2 21
  • 文章作者:Tyan博客:noahsnail.com | CSDN | 简书 声明:作者翻译论文仅为学习,如有侵权请...
    SnailTyan阅读 10,557评论 0 8
  • 一、课程大纲1.1课程内容介绍1.1.1 Supervised Learning关于监督型学习方法,本课程涉及到的...
    xiaorun阅读 5,080评论 0 1
  • 文章作者:Tyan博客:noahsnail.com | CSDN | 简书 声明:作者翻译论文仅为学习,如有侵权请...
    SnailTyan阅读 7,404评论 0 5