一 回归模型
工业界用的比较多的算法之一,一般基线系统都是使用回归模型,质量有保证。
首先,什么是回归?一般预测连续的值为回归问题,比如说房价问题,房价是连续的值,这类问题就是回归问题。还有一种分类问题,比如说分图片中的动物类别。
1.1 线性回归
1. 什么是线性回归
在这里,我们给出最简单的通俗的解释:
a.有监督学习,就是有输入/输出。学习样本为D={X,Y},X为输入参数,Y标准答案。
b.输出/预测的值yi∈Y是连续性的值;
c 需要学习预测模型y=f(x),
d 输入x和输出y之间存在线性关系
2.如何预测呢?
使用训练集数据,训练模型y=f(x),训练完成后,根据给定的x,计算输出的y就是预测的值。
思考一个简单的例子:例如同一地区的房价,面积越大,价格越高,面积和价格是线性关系。假设训练数据如下:
那么,根据这个输入的数据,得到一个训练模型。然后预测一下一个700平方英尺的房子,价格是多少?
我们把训练集画在二维坐标系中,找一条直线能很好地拟合所有的节点。y=ax+b
价格