1. 转化器
一般就是实例化一个转化器再调用转化器,具体的语句为:
transfer=, transfer.fit_transform
fit()的作用是计算每一列的平均值、标准差
transform()就是将上一步计算出的结果带入(x-mean) / std进行最终的转换,进行标准化
fit_transform就是直接进行标准化
2. 估计器
(1)用于分类的估计器
sklearn.neighbors k近邻算法、sklearn.native_bayes 贝叶斯
sklearn.linear_model.LogisticRegression 逻辑回归
(2)用于回归的估计器
sklearn.linear_model.LinearRegression 线性回归
sklearn.linear_model.Ridge 岭回归
(3)用于无监督学习的估计器
sklearn.cluster.KMeans 聚类
具体的工作流程如下:
a.实例化一个estimator
b.estimator.fit(x_train,y_train) 计算----调用完毕,模型生成
c.模型评估:
直接比对真实值和预测值
y_predict = estimator.predict(x_test)、y_test == y_predict
计算准确率
accuracy = estimator.score(x_test,y_test)
3. K-近邻算法
3.1原理
如果一个样本在特征空间总的K个最相近的特征空间中最邻近的样本中的大多数属于某一个类别,则该样本也属于这个类别
可以通过欧氏距离、曼哈顿距离、明可夫斯基距离计算样本之间的距离
3.2基本语句
sklearn.neighbor.KNeighborsClassifier(n_neighbors=5, algorithm='auto')
n_neighbors:int型,k_neighbors查询默认使用的邻居数;
algorithm:{‘auto’,‘ball_tree’,‘kd_tree’}之一
3.3实例化演示
具体步骤为:获取数据、数据集划分、特征工程:标准化、KNN预估器流程、模型评估