指标、性能

模型指标

MSE:均方误差,值越小越好
RMSE:均方根误差,值越小越好
MAE:平均绝对误差,值越小越好
R平方:【0,1】越接近1越好
ev:【0,1】越接近1越好

标准化

公式:(x-mean)/std

交叉验证

偏差——方差的折中

k较小时,偏差较低,方差较高,测试集小
k较高时,偏差较高,方差较低,测试集大

交叉验证的辅助功能:参数调节,模型选择,特征选择

实验处理方式

1.集中处理方式:将数据分为2部分,训练集与测试集
2.交叉验证:利用交叉验证的结果作为参数选择的标准,同时也作为模型择优的标准
3.分两步:将数据集划分为两部分,一部分为训练集,一部分为测试集,用训练集做交叉验证选择最优参数,用测试集来选择最优模型,同时,也由测试集来生成预测误差

归一化

特征值域跨度大,调整量纲
1.等高线的图(联想),加快梯度下降时收敛的速度
2.提高精度,因有些模型需要计算距离,如果值域跨度相差大,那距离计算就主要取决于值域大的(可否让相关性大的特征缩放小一点,原则上不能,后面特征工程中会讲到,可以对某些重要的特征再进行组合)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容