[机器学习笔记2]线性回归算法学习(一)

1.假设函数h(x) = θ0 + θ1*x
模型参数:θ0,θ1

2.训练集

索引 面积 售价
1 2104 460
2 1416 232
3 1534 315
4 852 178
.. .. ..

约定几个变量如下:

  • m:训练样本的数目,这里m=4
  • x:输入变量,或者叫做特征 这里的房屋面积就是x
  • y:输出变量,就是预测的目标变量 这里的房屋售价就是y
    (x(i), y(i))代表第i个样本

3.学习算法的目的:选择合适的模型参数θ0,θ1,来使假设函数表示的直线尽量的和数据集中的点很好的拟合,即在假设函数中,输入变量x的值,得到的预测值h(x)能尽可能的接近样本对应的y值,即选择合适的θ0,θ1值使得(h(x) - y)²最小

4.代价函数

代价函数J(θ0,θ1)

学习算法的目的就是关于θ0,θ1对J(θ0,θ1)求最小值
根据以上的约定,可以理解代价函数的意义,先求得在所有样本上假设函数预测值与实际样本值得误差平方和,再除以样本值,得到平均误差,再乘以1/2,此处未理解为什么要乘以1/2

接下来继续学习,如何编写算法寻找J(θ0,θ1)的最小值

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。