登录注册写文章

scikit_learn学习笔记六——scikit_learn里的fit与fit_transform

深思海数_willschang

scikit_learn学习笔记六——scikit_learn里的fit与fit_transform

scikit_learn里的fit与fit_transform

# 从sklearn.preprocessing导入StandardScaler
from sklearn.preprocessing import StandardScaler
# 标准化数据，保证每个维度的特征数据方差为1，均值为0，使得预测结果不会被某些维度过大的特征值而主导
ss = StandardScaler()
# fit_transform()先拟合数据，再标准化
X_train = ss.fit_transform(X_train)
# transform()数据标准化
X_test = ss.transform(X_test)

二者的功能都是对数据进行某种统一处理（比如标准化~N(0,1)，将数据缩放(映射)到某个固定区间，归一化，正则化等）
fit_transform(partData)对部分数据先拟合fit，找到该part的整体指标，如均值、方差、最大值最小值等等（根据具体转换的目的），然后对该partData进行转换transform，从而实现数据的标准化、归一化等等。
tansform(restData)根据对之前部分fit的整体指标，对剩余的数据（restData）使用同样的均值、方差、最大最小值等指标进行转换transform(restData)，从而保证part、rest处理方式相同。

fit_transform

必须先用fit_transform(partData)，之后再transform(restData)

如果直接transform(partData)，程序会报错
如果fit_transfrom(partData)后，使用fit_transform(restData)而不用transform(restData)，虽然也能归一化，但是两个结果不是在同一个“标准”下的，具有明显差异。

image.png

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

《Scikit-Learn与TensorFlow机器学习实用指南》第02章一个完整的机器学...
（第一部分机器学习基础）第01章机器学习概览第02章一个完整的机器学习项目（上）第02章一个完整的机器学习...
SeanCheney阅读 19,905评论 20赞 62
【转载】Scikit-learn：数据预处理Preprocessing data
https://blog.csdn.net/pipisorry/article/details/52247679 ...
dopami阅读 5,604评论 0赞 1

岁末，看画知味（七）
与前面几周不同，本周只看一张画：法国新印象派——点彩派代表乔治.修拉的作品《大碗岛星期日的下午》。书写主题：还记...
陌上花开wen阅读 3,437评论 0赞 2
朋友圈心态
（一）朋友圈里无真相。几个月功夫翻了几页书，来个绿皮火车闲读，一副手不释卷嗜读如命派头；阳春三月一趟出游，照片...
我馬虺隤阅读 2,880评论 2赞 3
七绝•银叶金合欢
嫩时叶绿壮时银，花到合欢瓣变金。色幻容颜牵岁月，山前每赏总开心。（新韵网图）
珠江潮平阅读 5,272评论 23赞 36

友情链接更多精彩内容

4赞5赞

赞赏

手机看全文