介绍
scikit-learn是python机器学习库,官方是这样介绍的:
- 简单高效的数据挖掘和数据分析工具
- 可供大家使用,可在各种环境中重复使用
- 建立在 NumPy,SciPy 和 matplotlib 上
- 开放源码,可商业使用 - BSD license
官网:scikit-learn官网
在我看来,就是里面封装了各种各样好用的算法,用来分析很方便,刚刚偶然发现了他的中文文档scikit-learn中文
安装
接下来,我们开始安装下
Scikit-learn requires:
Python (>= 2.7 or >= 3.3),
NumPy (>= 1.8.2),
SciPy (>= 0.13.3).
pip install -U scikit-learn
昨天安装的时候没有遇到问题,直接就可以了,下面我们来简单使用下。
就数据分析来说,首先得有数据,scikit-learn自带了很多的数据集,我们来看看
这里,我们家在一个鸢尾花数据集
# -*- coding: utf-8 -*-
"""
Created on Tue Jun 12 16:56:08 2018
@author: guiyang.yu
"""
from sklearn import datasets
# 加载鸢尾花数据集
iris=datasets.load_iris()
print(iris)
如果没有问题的话,会正确输出结果
关于数据集更多的介绍,可以看这里5. 数据集加载工具
好了,这里就说这么多,后面我们来一个具体的例子来一步一步学习scikit-learn