关于python工具包sklearn的学习1

scikit-learn里面的算法包在python做机器学习的时候经常用到。

关于sklearn调用算法包的过程：
1.准备好测试集、训练集
2.提取好训练集、测试集的特征值和因变量的值
3.把训练集特征值和因变量的值传入算法中计算
4.把测试集的特征值传入算法做预测5.计算误差

注意：

1.特征值的格式：行装入的是每一个特征的值，也就是说，列的个数就是特征的个数，而行数就是样本的个数，也就是训练集的数量。
###列的个数：特征的特殊
###行的个数：样本训练集个数

2.最好在做误差计算的时候，先看返回的预测值所构成的向量是行向量还是列向量3.因为Python是面向对象编程的，所以，sklearn的算法包也是这样的。因此在调用的时候先指定对象。如在线性回归的预测中，可以先执行下面的代码dd = sklearn.linear_model.LinearRegression（）

这行代码先指定线性回归的对象dd，然后在执行dd.fit（）就可以进行回归了

4.关于选择最佳参数（模型）：ridgeRegression = sklearn.linear_model.RidgeCV(alphas=[0.01, 0.05, 0.1, 0.5, 1.0, 10.0])#在岭回归中，通过调用RidgeCV来直接交叉验证要测试的几个惩罚因子#每个线性回归模型都有相应的VC方法来交叉验证参数。ridgeRegression.alpha_#这行代码是可以查看上行代码带选取的最佳的惩罚因子

最后编辑于：2017.12.05 00:13:29

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

关于python工具包sklearn的学习1

关于python工具包sklearn的学习1

注意：

这行代码先指定线性回归的对象dd，然后在执行dd.fit（）就可以进行回归了

相关阅读更多精彩内容

友情链接更多精彩内容