sklearn sci-kit learn
pip install sklearn
sklearn google 间接开发,资助项目
sklearn
简单高效的预测数据分析工具
每个人都可以访问,并且可以在各种情况下重用
基于Numpy,SciPy和matplotlib构建
开源,可商业使用-BSD许可证
sklearn分成几部分
分类
回归
聚类
降维
筛选模型
预处理
线性回归模型归根结底,求解方程的系数和截距
- 20多年的学习生涯,解过很多方程
- 简单的方程
- 计算,提升能力:解非常复杂的方程
- 计算机+X
- 互联网+X
- 计算机+天文 天文挣钱少,做金融(兴业银行)
- 阿里云 王坚 去年评为中国工程院院士
王坚 心理学
研究人的心理在行,研究计算机的心理,也在行
计算机心理:算法,怎么‘走’的
使用sklearn的API
linear_model.LinearRegression
线性回归
将问题数学化 - 为了解决大部分案例(个例,特例,不在考虑的范围内)
数据挖掘 = 机器学习 = 数据建模
将实际问题转化成数学问题,进行求解
数据问题,就是方程
之前的物理数学,化学大佬理论:都是数学公式
数据挖掘:从海量的数据中找到规律(算法)
数据分析:汇总、平均、差异、可视化......(直观的进行展示)