统计-交叉验证

应用场景:

  • 当我们想预测某一事物时,有若干种机器学习算法,如逻辑回归,K-nearest neighbors,SVM,该选哪一个呢?
  • 交叉验证会告诉我们哪个最好

原理:

  • 在机器学习中,我们需要一部分训练集数据找到参数,还需要验证集数据来检验参数是否合适
  • 理想的比例:75%训练集,25%验证集
  • 交叉验证通过不断更换验证集的成分,来验证模型的准确性


  • 将数据分成10分,进行的十折交叉验证,是实际中最常用的


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容