R语言学习笔记:模型选择(三)LASSO方法

红点代表均方误差和上下一倍标准差,均方误差越小模型越好;上方数量表明模型仍存在的自变量个数(不一定是单调递减)。第一条虚线处表明均方误差最小值;第二个虚线标出最低点的一倍标准差的位置,表示牺牲一倍标准差的情况下可以得到的最简单的模型

查看第一条竖线(MSE最小):lasso1.cv$lambda.min

查看第二条竖线:一倍标准误:lasso1.cv$lambda.1se

coef (lasso1.cv, s = "lambda.1se")


存在一定问题:没有显著性;结果是有偏的。实际操作当中常用的办法是使用lasso找出一组系数不为0的自变量后,再对这些自变量使用多元线性回归,即relaxed lasso。并且很少有人直接使用lasso作为预测模型,主要是通过lasso从自变量中筛选出相对重要的一些自变量

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容