CS229_1-线性回归
线性回归
我们在上一节房屋售价数据集的基础上,增添房间数量这一特征变量,如下图所示:

因此,特征变量变为了维度为2的向量,记作
,其中
表示数据集中第i个房屋的房屋面积,则
表示数据集中第i个房屋的房间数量。
对于此监督学习问题,若我们采用线性回归模型,其假设函数为:
其中,表示以
为参数。为了便于向量化,我们令
,则上式可改写为:
从上式可知,为未知变量。那么我们该如何根据数据集计算出
的值呢?我们不妨回想一下假设函数
的定义。从上一小节可知,假设函数
是我们从给定数据集中学习得到的,其输出的值与数据集中的
越相近越好。因此,我们可以定义如下的代价函数(Cost Function):
当代价函数最小时,其参数
的值为我们所要的,从而得到了拟合训练集的最佳参数。