数据建模

sklearn sci-kit learn
pip install sklearn
sklearn google 间接开发,资助项目
sklearn
简单高效的预测数据分析工具
每个人都可以访问,并且可以在各种情况下重用
基于Numpy,SciPy和matplotlib构建
开源,可商业使用-BSD许可证
sklearn分成几部分
分类
回归
聚类
降维
筛选模型
预处理


image.png

image.png

线性回归模型归根结底,求解方程的系数和截距

  • 20多年的学习生涯,解过很多方程
  • 简单的方程
  • 计算,提升能力:解非常复杂的方程
  • 计算机+X
  • 互联网+X
  • 计算机+天文 天文挣钱少,做金融(兴业银行)
  • 阿里云 王坚 去年评为中国工程院院士
    王坚 心理学
    研究人的心理在行,研究计算机的心理,也在行
    计算机心理:算法,怎么‘走’的

使用sklearn的API

linear_model.LinearRegression
线性回归
将问题数学化 - 为了解决大部分案例(个例,特例,不在考虑的范围内)
f(x) = w_1x_1 + w_2x_2 + ......+w_13x_13 + b
数据挖掘 = 机器学习 = 数据建模
将实际问题转化成数学问题,进行求解
数据问题,就是方程
之前的物理数学,化学大佬理论:都是数学公式
数据挖掘:从海量的数据中找到规律(算法)
数据分析:汇总、平均、差异、可视化......(直观的进行展示)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 众所周知,Excel是全世界最酷炫的软件之一,除了日常的数据处理,图表分析等基本功能外,你还可以用excel做许多...
    马疼Teng阅读 4,480评论 1 9
  • 什么是主成分分析 主成分分析的概念 主成分分析(Principal Component Analysis,PCA)...
    醒你的cafe逗阅读 477评论 0 1
  • \今天我们来聊聊【完美】。我是一个追求完美的人,拿公众号推文排版举例,每个字的大小、行距、颜色我都会不断的尝试,挑...
    走猫步的巨蟹阅读 223评论 0 0
  • 文档对象模型 (DOM) 将 web 页连接到脚本或编程语言。通常这意味着 javascript, 但将 HTML...
    zjh111阅读 352评论 0 0
  • 国庆的第五天。晚上。要回校之前得看看老人家们再走吧,毕竟这是人之常情。进门,就听到奶奶说爷爷发烧了,我忽的有一股气...
    VickyChan阅读 136评论 0 0