机器学习百度百科:专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
原理:
- 机器学习是统计学习不是个案学习
- 大数定律:当试验次数越多,事件出现的频率无限接近于该事件出现的概率
- 建模:数据少,先验;数据多,后验
三个核心要素:
- 假设空间: 线性假设
- 优化目标 (实际值-预测值)平方的加和
- 寻解算法 (求解微分方程)
学习案例:
- 根据观察,设定Y=ax+b (a,b为参数,x为输入,y为输出)
-
设定优化目标了loss
y是实际值,y`是预测值,不同参数会产生不同的loss
- 求loss的最小值 loss=f(w) 微分方程或者梯度下降
- 取得最优解,验证结论
大数据的价值:
1.细分(准确) 2.分类的数据量(置信)
数据 模型 业务 需求