什么是交叉验证?什么是网格交叉验证?

交叉验证:

1)简单交叉验证:随机地将已给数据分为两部分,一部分作为训练集,另一部分作为测试集

sklearn.model_selection.train_test_split(*arrays**options)

2)S折交叉验证:首先随机的将已给数据切分为S个互不相交的大小相同的子集:然后利用S-1个子集的数据训练模型,利用余下的子集测试模型;将这一过程对可能的S种选择重复进行,最后选出S次评测中平均测试误差最小的模型.

class sklearn.model_selection.KFold(n_splits=’warn’shuffle=Falserandom_state=None)

3)留一交叉验证:S折交叉验证的特殊情形是S=N,称为留一交叉验证,往往在数据缺乏的情况下使用

网格交叉验证(网格搜索):

sklearn中对GridSearchCV的解释为:Exhaustive search over specified parameter values for an estimator.也就是说,网格交叉验证是对估计器的指定参数值穷举搜索.过给定不同的参数值的组合,验证选择出一组最优的Parameters.

小结:

网格交叉验证用于找到一组最优的参数组合,使得在这组参数下模型效果最好;而交叉验证主要用于模型的效果验证,它是对于数据集的测试集和验证集的选择,也能够有效的防止模型过拟合.所以说,这两者是不同的概念.

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 本内容为Udacity课程波士顿房价预测项目,欢迎阅读,有错的地方请留言。仅参考不建议作为其他用途。 优达学城毕业...
    MrMiaow阅读 14,493评论 1 18
  • 机器学习工程师纳米学位 模型评价与验证 项目 : 预测波士顿房价 第一步. 导入数据 在这个项目中,你将利用马萨诸...
    代号027阅读 3,862评论 0 1
  • 本文介绍Keras一些常见的验证和调参技巧,快速地验证模型和调节超参。 小技巧: CSV数据文件加载 Dense初...
    SpikeKing阅读 4,708评论 0 7
  • 抠图法 打开照片—复制图层—快速选择工具选择背景—编辑菜单—填充—前景色
    南下双鱼阅读 323评论 0 2
  • 有人说火箭永远无法冲出大气层,结果被SpaceX猎鹰打脸了;有人说高速铁路不可能实现,结果被和谐号打脸了;有人说网...
    4a8114f921c9阅读 370评论 0 0