1.假设函数:h(x) = θ0 + θ1*x
模型参数:θ0,θ1
2.训练集:
索引 | 面积 | 售价 |
---|---|---|
1 | 2104 | 460 |
2 | 1416 | 232 |
3 | 1534 | 315 |
4 | 852 | 178 |
.. | .. | .. |
约定几个变量如下:
- m:训练样本的数目,这里m=4
- x:输入变量,或者叫做特征 这里的房屋面积就是x
- y:输出变量,就是预测的目标变量 这里的房屋售价就是y
(x(i), y(i))代表第i个样本
3.学习算法的目的:选择合适的模型参数θ0,θ1,来使假设函数表示的直线尽量的和数据集中的点很好的拟合,即在假设函数中,输入变量x的值,得到的预测值h(x)能尽可能的接近样本对应的y值,即选择合适的θ0,θ1值使得(h(x) - y)²最小
4.代价函数:
代价函数J(θ0,θ1)
学习算法的目的就是关于θ0,θ1对J(θ0,θ1)求最小值
根据以上的约定,可以理解代价函数的意义,先求得在所有样本上假设函数预测值与实际样本值得误差平方和,再除以样本值,得到平均误差,再乘以1/2,此处未理解为什么要乘以1/2
接下来继续学习,如何编写算法寻找J(θ0,θ1)的最小值