声明:本文集的所有文章都只讨论Python如何使用sklearn
进行机器学习。且学习的部分截图来自中国大学MOOC上的Python机器学习应用课程以及EduCoder,侵权删。
2020.2.28
还有几天就要开始令人窒息的网课了,算得上是放假的最后这几天就好好补全一下之前的学习记录啦,自己已经完成了Python机器学习的学习了。
一.关于scikit-learn
1. 概述
scikit-learn
是基于Numpy
、Scipy
和Matplotlib
的一个Python机器学习库。它是Python机器学习一个十分重要的库,支持机器学习的 分类、回归、聚类、降维 等,并且带有标准数据库供使用。
2. 安装与使用
-
scikit-learn
可以通过命令行使用pip安装pip install scikit-learn
但要注意的是, 安装
scikit-learn
需要按照numpy
、scipy
、matplotlib
、scikit-learn
的顺序,否则会出错。 -
使用
scikit-learn
时,导入时是写为sklearn
的from sklearn import xxxxx
二. sklearn标准库
1. 数据库
1. scikit-learn
中自带了如下的数据库以及使用的方法。
想要使用以上的数据集,只要像以下的形式来导入即可,以load_boston
为例
from sklearn.database import load_boston
'''
boston = load_boston() # 这种情况下,是直接实例化一个对象而不返回其data和target
'''
data, target = load_boston(return_X_y=True) # 默认False,不返回data和target
2. 各个模块支持的算法
以下是从中国大学MOOC截取的截图,是scikit-learn
支持的几大任务中可以使用的算法。
-
分类
-
回归
-
聚类
-
降维